月之暗面发布开源思考模型Kimi K2 Thinking，国产大模型在Agent领域实现重大突破

北京月之暗面科技有限公司于2025年11月6日正式发布开源思考模型Kimi K2 Thinking，该模型基于”模型即Agent”理念开发，具备原生工具调用与多轮推理能力，标志着国产大模型在通用智能体（Agentic）领域取得重要突破。

技术架构方面，Kimi K2 Thinking采用混合专家（MoE）架构，总参数量达1万亿，激活参数32B，支持INT4量化与256K上下文窗口。其核心创新在于实现了思考过程与工具调用的无缝衔接，无需人工干预即可完成200-300次连续工具调用，通过数百步连贯推理解决复杂问题。在官方演示案例中，该模型曾通过23次交织的推理与工具调用成功破解博士级数学难题。

性能表现上，该模型在多项权威基准测试中刷新纪录：在评估综合学术能力的”人类最后的考试”（HLE）中取得44.9%的准确率；在OpenAI发布的BrowseComp网络浏览能力测试中以60.2%的得分超越人类平均水平（29.2%）；在SWE-Bench Verified编程测试中达到71.3分，展现出色的代码生成能力，可自主创建包含3D粒子银河、动态光照场景等复杂视觉效果的HTML代码。

商业化应用方面，月之暗面已同步开放API接口服务，支持最长128K上下文，全新升级的ToolCall功能可严格保障格式正确性。用户可通过Kimi官网、最新版移动应用及开放平台接入服务，在”工具箱”中启用”长思考”模式即可体验复杂任务处理能力。模型代码与权重遵循MIT开源协议，开发者可通过Hugging Face和ModelScope平台获取。

行业分析指出，该模型的发布进一步缩小了开源模型与闭源模型的性能差距，其多模态推理与自主工具调用能力为AI辅助科研、智能编程等场景提供了新的技术解决方案。随着测试时扩展技术的成熟，月之暗面表示将持续优化模型的思考token数量与工具调用步数，全智能体模式将于近期推出。

文章版权归作者所有，未经允许请勿转载。

月之暗面发布开源思考模型Kimi K2 Thinking，国产大模型在Agent领域实现重大突破

科大讯飞发布星火X1.5大模型：国产AI实现重大突破，数学能力超越GPT-5

谷歌发布第七代TPU Ironwood：性能提升4倍，挑战英伟达AI芯片霸主地位

相关文章

谷歌发布AI浏览器Disco：用Gemini 3将网页变成智能应用

CRISPR-GPT智能系统：AI驱动基因编辑技术取得突破性进展

Hugging Face发布LeRobot v0.4.0：机器人技术民主化的重要里程碑

xAI即将发布Grok 4系列大模型，马斯克亲自确认技术突破

最新资讯

热门AI工具

热门资讯