美团于2025年8月31日正式开源其5600亿参数混合专家模型LongCat-Flash,该模型通过引入“零计算专家”和稀疏条件混合专家(ScMoE)架构,显著提升推理效率与速度。此次开源标志着美团在AI大模型领域的技术突破进入规模化应用阶段。
技术架构方面,LongCat-Flash采用动态参数激活机制,在处理任务时仅调用相关专家模块,而非全量参数计算。其中“零计算专家”技术能自动识别并跳过冗余计算节点,官方测试显示该设计使模型在中文任务中的推理速度提升3倍,同时保持与稠密模型相当的准确率。ScMoE模块则通过层级化专家路由策略,将计算资源集中分配给任务关键路径,实现5600亿参数规模下单任务仅激活约80亿参数的效果。
性能表现上,该模型在权威中文基准测试中综合得分接近DeepSeek等头部开源模型,尤其在本地生活场景的意图理解、多轮对话等任务中展现优势。GitHub发布的三行代码调用示例显示,开发者可通过美团云平台直接部署模型推理服务,显著降低大模型应用门槛。
美团技术团队透露,LongCat-Flash已在其内部办公场景完成验证,涵盖智能编程助手、会议纪要生成等18项高频应用。公司创始人王兴在近期财报会议中强调,该技术将成为连接线上线下的核心基础设施,未来将重点投入AI芯片研发以支持模型迭代。行业观察人士指出,这是继3月内部应用披露后,美团首次将大模型技术栈开放给开发者生态,或将重塑本地生活服务的智能化竞争格局。
© 版权声明
文章版权归作者所有,未经允许请勿转载。