英伟达Jet-Nemotron开源:2B/4B参数模型实现53倍推理吞吐量突破 英伟达发布全面开源的Jet-Nemotron系列AI语言模型,通过PostNAS架构优化与JetBlock模块实现47-53倍推理速度提升,在MMLU-Pro等基准测试中超越Qwen3、Gemma3等... AI产品动态# AI大模型# Jet-Nemotron# PostNAS 3周前
阿里云发布PAI-TurboX加速框架,助力自动驾驶研发效率提升50%以上 阿里云2025年推出PAI-TurboX自动驾驶专用加速框架,通过CPU亲和性优化与智能数据加载技术实现训练时间缩短58.5%,为车企提供端到端AI解决方案。 AI产品动态# AI框架# PAI-TurboX# 推理优化 3个月前
MiniMax发布M1推理模型:突破百万Token上下文极限,成本效率双提升 MiniMax发布M1推理模型,该模型凭借支持100万Token上下文窗口及8万Token推理输出的能力,成为全球长文本处理领域的新标杆。 AI产品动态# AI技术# 开源模型# 推理优化 3个月前