美团开源5600亿参数混合专家模型LongCat-Flash，推理速度提升3倍

AI产品动态9个月前发布 AI视野

美团于2025年8月31日正式开源其5600亿参数混合专家模型LongCat-Flash，该模型通过引入“零计算专家”和稀疏条件混合专家（ScMoE）架构，显著提升推理效率与速度。此次开源标志着美团在AI大模型领域的技术突破进入规模化应用阶段。

技术架构方面，LongCat-Flash采用动态参数激活机制，在处理任务时仅调用相关专家模块，而非全量参数计算。其中“零计算专家”技术能自动识别并跳过冗余计算节点，官方测试显示该设计使模型在中文任务中的推理速度提升3倍，同时保持与稠密模型相当的准确率。ScMoE模块则通过层级化专家路由策略，将计算资源集中分配给任务关键路径，实现5600亿参数规模下单任务仅激活约80亿参数的效果。

性能表现上，该模型在权威中文基准测试中综合得分接近DeepSeek等头部开源模型，尤其在本地生活场景的意图理解、多轮对话等任务中展现优势。GitHub发布的三行代码调用示例显示，开发者可通过美团云平台直接部署模型推理服务，显著降低大模型应用门槛。

美团技术团队透露，LongCat-Flash已在其内部办公场景完成验证，涵盖智能编程助手、会议纪要生成等18项高频应用。公司创始人王兴在近期财报会议中强调，该技术将成为连接线上线下的核心基础设施，未来将重点投入AI芯片研发以支持模型迭代。行业观察人士指出，这是继3月内部应用披露后，美团首次将大模型技术栈开放给开发者生态，或将重塑本地生活服务的智能化竞争格局。

文章版权归作者所有，未经允许请勿转载。

美团开源5600亿参数混合专家模型LongCat-Flash，推理速度提升3倍

字节跳动发布AetherCode：新一代AI代码生成平台全面解析

苹果内部测试AI助手Asa：提升员工产品知识与销售技巧

相关文章

Anthropic发布LLM Agent工具开发指南：三步流程提升AI效率，响应压缩41%

上海交大突破性AI研究：热辐射超材料逆向设计登上《自然》杂志

吉利汽车在WAIC 2025展示全域AI技术体系，引领汽车智能化新趋势

阿里开源3D数字人框架Mnn3dAvatar，支持面部捕捉和3D 虚拟角色动画映射

最新资讯

热门AI工具

热门资讯