蚂蚁集团发布万亿参数大模型Ling-1T,多项性能超越谷歌Gemini

蚂蚁集团于2025年10月9日正式发布并开源其万亿参数通用语言模型Ling-1T,作为蚂蚁百灵大模型Ling 2.0系列的首款旗舰产品。该模型是目前全球开源模型中规模最大、能力最强的非思考类大模型,标志着中国在人工智能领域的技术突破。

Ling-1T在多项高难度基准测试中展现出卓越性能。在竞赛数学领域,该模型以平均4000+ Token的消耗达到70.42%的准确率,优于谷歌Gemini-2.5-Pro(5000+ Token,70.10%准确率)。在代码生成、软件开发、逻辑推理等专业领域,Ling-1T同样取得领先成绩,多项指标位居开源模型榜首。

技术架构方面,Ling-1T采用Ling 2.0架构,基于20T+ tokens的高质量语料完成预训练,支持128K上下文窗口。其创新性地采用FP8混合精度训练技术,成为目前已知规模最大的FP8训练基座模型,实现15%以上的端到端加速和显著的显存节省。在强化学习阶段,蚂蚁团队提出的LPO(Linguistics-Unit Policy Optimization)方法,以句子为粒度进行策略优化,有效提升了模型训练的稳定性。

值得注意的是,Ling-1T展现出突出的跨领域泛化能力。在未进行专门训练的情况下,该模型在智能体工具调用任务中达到约70%的准确率,能够处理从复杂逻辑问题到多语种文本创作等多样化任务。蚂蚁团队表示,这些能力构成了未来通用智能体的关键基础。

此次发布正值全球AI竞赛白热化阶段。Ling-1T的开源被视为中国企业在人工智能领域的重要布局,将与OpenAI、DeepSeek等国际领先模型展开直接竞争。蚂蚁集团同时透露,其万亿参数级深度思考大模型Ring-1T的preview版已于9月30日开源,显示出持续加码AI技术研发的决心。

尽管取得显著进展,蚂蚁团队也坦承Ling-1T存在推理成本偏高、智能体能力待强化等局限,计划通过混合注意力架构等技术创新持续优化。目前开发者可通过Hugging Face等平台体验该模型。

© 版权声明

相关文章