推理优化

共 4 篇AI资讯

推理优化

排序

发布更新浏览

蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0模型：长文本推理成本降至传统模型1/10

蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0模型：长文本推理成本降至传统模型1/10

蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0混合线性推理模型，通过线性Attention技术将长文本推理成本降至传统模型十分之一，推理效率提升12倍...

AI产品动态 # AI成本降低 # AI模型 # 开源AI

8个月前

英伟达Jet-Nemotron开源：2B/4B参数模型实现53倍推理吞吐量突破

英伟达Jet-Nemotron开源：2B/4B参数模型实现53倍推理吞吐量突破

英伟达发布全面开源的Jet-Nemotron系列AI语言模型，通过PostNAS架构优化与JetBlock模块实现47-53倍推理速度提升，在MMLU-Pro等基准测试中超越Qwen3、Gemma3等...

AI产品动态 # AI大模型 # Jet-Nemotron # PostNAS

9个月前

阿里云发布PAI-TurboX加速框架，助力自动驾驶研发效率提升50%以上

阿里云发布PAI-TurboX加速框架，助力自动驾驶研发效率提升50%以上

阿里云2025年推出PAI-TurboX自动驾驶专用加速框架，通过CPU亲和性优化与智能数据加载技术实现训练时间缩短58.5%，为车企提供端到端AI解决方案。

AI产品动态 # AI框架 # PAI-TurboX # 推理优化

11个月前

MiniMax发布M1推理模型：突破百万Token上下文极限，成本效率双提升

MiniMax发布M1推理模型：突破百万Token上下文极限，成本效率双提升

MiniMax发布M1推理模型，该模型凭借支持100万Token上下文窗口及8万Token推理输出的能力，成为全球长文本处理领域的新标杆。

AI产品动态 # AI技术 # 开源模型 # 推理优化

12个月前