美团发布LongCat-Flash-Thinking大模型：国内首款双轨推理AI，数学代码能力全面升级

AI产品动态2个月前发布 AI视野

美团于9月22日正式发布高效推理模型LongCat-Flash-Thinking，这是继9月1日开源LongCat-Flash-Chat后，其大模型技术体系的又一次重要升级。新模型在保持前代产品高速推理能力的同时，强化了逻辑、数学、代码及智能体任务的专项性能，成为国内首个兼具“深度思考+工具调用”与“非形式化+形式化”双轨推理能力的大语言模型。

技术架构方面，LongCat-Flash-Thinking采用领域并行强化学习训练方法，通过解耦STEM、代码和智能体任务的优化过程，实现多领域能力均衡提升。其异步弹性共卡系统（DORA）支持万卡规模集群的稳定运行，在大规模异步强化学习阶段仅需预训练20%的算力投入即可完成性能优化。实测数据显示，该模型在AIME25框架下的智能体工具调用任务中，较传统方法节省64.5%的Token消耗，同时维持90%的准确率。

性能表现上，模型在ARC-AGI基准测试中以50.3分超越多款国际顶尖闭源模型，HMMT和AIME数学评测成绩与Qwen3-235B-A22B-Thinking等领先开源模型持平。部分复杂任务表现接近闭源标杆GPT5-Thinking，尤其在形式化定理证明等高难度领域展现显著优势。

目前，LongCat-Flash-Thinking已在Hugging Face和GitHub全面开源，用户可通过官网体验实时推理。此次发布是美团AI战略的重要落子，与其近期推出的AI Agent产品小美App、垂直场景工具NoCode等形成技术协同，进一步巩固其在智能本地生活服务领域的技术壁垒。

文章版权归作者所有，未经允许请勿转载。

美团发布LongCat-Flash-Thinking大模型：国内首款双轨推理AI，数学代码能力全面升级

联发科天玑9500旗舰芯片9月22日发布：全大核设计+100TOPS AI算力，安卓阵营迎战高通骁龙

百度网盘海外版全面开放注册新增多项AI学习办公功能

相关文章

腾讯开源混元世界模型1.1：单卡秒级3D重建，降低内容生成门槛

亚马逊发布AI代理工具Seller Assistant，助力第三方卖家提升运营效率

阶跃星辰与吉利汽车深度合作，打造AI智能座舱新标杆

Meta发布MobileLLM-R1系列小参数模型，端侧AI推理效率突破新高

最新资讯

热门AI工具

热门资讯

美团发布LongCat-Flash-Thinking大模型：国内首款双轨推理AI，数学代码能力全面升级

联发科天玑9500旗舰芯片9月22日发布：全大核设计+100TOPS AI算力，安卓阵营迎战高通骁龙

百度网盘海外版全面开放注册 新增多项AI学习办公功能

相关文章

腾讯开源混元世界模型1.1：单卡秒级3D重建，降低内容生成门槛

亚马逊发布AI代理工具Seller Assistant，助力第三方卖家提升运营效率

阶跃星辰与吉利汽车深度合作，打造AI智能座舱新标杆

Meta发布MobileLLM-R1系列小参数模型，端侧AI推理效率突破新高

最新资讯

热门AI工具

热门资讯

百度网盘海外版全面开放注册新增多项AI学习办公功能