月之暗面开源多模态模型Kimi-VL-A3B-Thinking-2506,性能超越GPT-4o

月之暗面(Moonshot AI)于2025年6月23日正式开源多模态模型Kimi-VL-A3B-Thinking-2506,这是该系列模型继两个月前首次开源后的重大升级版本。新模型以2.8亿激活参数(16亿总参数)的轻量级架构,在数学推理、视频理解等多项多模态任务中展现出超越GPT-4o等主流大模型的性能表现。

技术性能方面,2506版本在多模态推理基准测试中实现显著突破:MathVision准确率提升20.1个百分点至56.9%,MathVista达到80.1%(提升8.4%),MMMU-Pro和MMMU分别提升至46.3%和64.0%。值得注意的是,模型在取得更高准确率的同时,平均思考长度(token消耗)减少20%,实现效率与性能的双重优化。

该版本首次实现”边思考边感知”的能力跃迁,在保持思考型任务优势的基础上,常规视觉理解任务表现同步提升。测试数据显示,MMBench-EN-v1.1得分84.4,MMStar 70.4,RealWorldQA 70.0,MMVet 78.4,均达到或超越其非思考版本Kimi-VL-A3B-Instruct的水平。视频理解能力成为本次升级的另一亮点,模型在视频推理基准测试中取得突破性进展。

开发者可通过Hugging Face平台获取模型开源代码,其轻量化架构设计为研究者在有限算力条件下部署高性能多模态模型提供了新选择。此次升级标志着月之暗面在实现”高效能小模型”技术路线上取得阶段性成果,为多模态大模型领域的开源生态注入新动能。

© 版权声明

相关文章