DeepSeek-V3.2系列发布：开源模型推理与智能体能力突破，多项指标比肩GPT-5

AI产品动态6个月前发布 AI视野

深度求索（DeepSeek）于2025年12月1日正式发布DeepSeek-V3.2系列大语言模型，包含标准版V3.2与高性能变体V3.2-Speciale。此次更新标志着开源模型在推理能力与智能体（Agent）功能上的重大突破，多项性能指标已接近或达到GPT-5、Gemini-3.0-Pro等顶尖闭源商业模型水平。

标准版V3.2定位日常应用场景，通过优化DSA稀疏注意力机制，在保证推理性能的同时显著缩短输出长度。公开测试显示，其推理类基准表现与GPT-5相当，较Kimi-K2-Thinking模型减少约30%的计算开销与响应延迟。该版本首次实现”思考模式”下的工具调用融合，支持多轮推理与外部工具交互，其训练采用包含1800个模拟环境、8.5万条复杂指令的强化学习数据集，在智能体评测中创下开源模型最优成绩。

V3.2-Speciale作为研究专用版本，融合DeepSeek-Math-V2的数学证明模块，在四项国际顶级竞赛模拟中表现突出：斩获IMO 2025（国际数学奥林匹克）、CMO 2025（中国数学奥林匹克）金牌，并在ICPC World Finals 2025（国际大学生程序设计竞赛）与IOI 2025（国际信息学奥林匹克）中分别达到人类选手第二与第十名的历史性成绩。该版本因长推理链导致Token消耗较高，目前仅通过临时API开放至12月15日供学术研究。

技术团队透露，两个版本均已在HuggingFace和ModelScope平台开源，API文档同步更新多轮思维链传递机制，支持开发者构建复杂Agent应用。此次升级验证了开源模型在关键性能指标上缩小与商业模型的差距，但Speciale版本暂未优化日常对话场景，主要面向专业研究需求。

文章版权归作者所有，未经允许请勿转载。

DeepSeek-V3.2系列发布：开源模型推理与智能体能力突破，多项指标比肩GPT-5

摩尔线程发布Torch-MUSA v2.7.0：AI训练推理性能大幅提升，算子总量突破1050个

字节跳动豆包手机助手技术预览版发布：AI助手实现系统级整合，首发中兴nubia M153

相关文章

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

字节跳动发布Seedance 1.5 pro音视频生成模型：AI内容创作进入视听融合新阶段

OpenAI联手茱莉亚学院布局AI音乐生成，剑指谷歌Lyria与字节Seed-Music

面壁智能发布MiniCPM 4.1基座模型：稀疏架构突破AI推理效率瓶颈

最新资讯

热门AI工具

热门资讯