DeepSeek-V3.2系列发布:开源模型推理与智能体能力突破,多项指标比肩GPT-5

深度求索(DeepSeek)于2025年12月1日正式发布DeepSeek-V3.2系列大语言模型,包含标准版V3.2与高性能变体V3.2-Speciale。此次更新标志着开源模型在推理能力与智能体(Agent)功能上的重大突破,多项性能指标已接近或达到GPT-5、Gemini-3.0-Pro等顶尖闭源商业模型水平。

标准版V3.2定位日常应用场景,通过优化DSA稀疏注意力机制,在保证推理性能的同时显著缩短输出长度。公开测试显示,其推理类基准表现与GPT-5相当,较Kimi-K2-Thinking模型减少约30%的计算开销与响应延迟。该版本首次实现”思考模式”下的工具调用融合,支持多轮推理与外部工具交互,其训练采用包含1800个模拟环境、8.5万条复杂指令的强化学习数据集,在智能体评测中创下开源模型最优成绩。

V3.2-Speciale作为研究专用版本,融合DeepSeek-Math-V2的数学证明模块,在四项国际顶级竞赛模拟中表现突出:斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)金牌,并在ICPC World Finals 2025(国际大学生程序设计竞赛)与IOI 2025(国际信息学奥林匹克)中分别达到人类选手第二与第十名的历史性成绩。该版本因长推理链导致Token消耗较高,目前仅通过临时API开放至12月15日供学术研究。

技术团队透露,两个版本均已在HuggingFace和ModelScope平台开源,API文档同步更新多轮思维链传递机制,支持开发者构建复杂Agent应用。此次升级验证了开源模型在关键性能指标上缩小与商业模型的差距,但Speciale版本暂未优化日常对话场景,主要面向专业研究需求。

© 版权声明

相关文章