月之暗面发布开源思考模型Kimi K2 Thinking,国产大模型在Agent领域实现重大突破

AI产品动态7小时前发布 AI视野

北京月之暗面科技有限公司于2025年11月6日正式发布开源思考模型Kimi K2 Thinking,该模型基于”模型即Agent”理念开发,具备原生工具调用多轮推理能力,标志着国产大模型在通用智能体(Agentic)领域取得重要突破。

技术架构方面,Kimi K2 Thinking采用混合专家(MoE)架构,总参数量达1万亿,激活参数32B,支持INT4量化与256K上下文窗口。其核心创新在于实现了思考过程与工具调用的无缝衔接,无需人工干预即可完成200-300次连续工具调用,通过数百步连贯推理解决复杂问题。在官方演示案例中,该模型曾通过23次交织的推理与工具调用成功破解博士级数学难题。

性能表现上,该模型在多项权威基准测试中刷新纪录:在评估综合学术能力的”人类最后的考试”(HLE)中取得44.9%的准确率;在OpenAI发布的BrowseComp网络浏览能力测试中以60.2%的得分超越人类平均水平(29.2%);在SWE-Bench Verified编程测试中达到71.3分,展现出色的代码生成能力,可自主创建包含3D粒子银河、动态光照场景等复杂视觉效果的HTML代码。

商业化应用方面,月之暗面已同步开放API接口服务,支持最长128K上下文,全新升级的ToolCall功能可严格保障格式正确性。用户可通过Kimi官网、最新版移动应用及开放平台接入服务,在”工具箱”中启用”长思考”模式即可体验复杂任务处理能力。模型代码与权重遵循MIT开源协议,开发者可通过Hugging Face和ModelScope平台获取。

行业分析指出,该模型的发布进一步缩小了开源模型与闭源模型的性能差距,其多模态推理与自主工具调用能力为AI辅助科研、智能编程等场景提供了新的技术解决方案。随着测试时扩展技术的成熟,月之暗面表示将持续优化模型的思考token数量与工具调用步数,全智能体模式将于近期推出。

© 版权声明

相关文章