谷歌推出Gemini 2.5 Deep Think模型,AI推理能力再升级

谷歌于8月1日正式推出Gemini 2.5 Deep Think模型,现已面向Google AI Ultra订阅用户开放。这款新模型在多项基准测试中表现优异,超越了OpenAI的o3和xAI的Grok 4。

Gemini 2.5 Deep Think是今年5月Google I/O大会上首次亮相的Deep Think模式的升级版,采用多假设推理方法,结合早期用户反馈和最新研究优化而成。相比初始版本,新模型在性能上有显著提升。值得注意的是,该模型是此前国际数学奥林匹克竞赛(IMO)金牌模型的变体,但为适应日常使用场景进行了加速优化,因此在2025年IMO基准测试中达到铜牌水平。

测试数据显示,Gemini 2.5 Deep Think在LiveCodeBench V6、Humanity’s Last Exam、IMO 2025和AIME 2025等项目中表现突出。目前,Google AI Ultra用户可在Gemini应用中每日限次使用该功能,输入栏会显示“Deep Think”选项,并自动集成代码执行和谷歌搜索等工具。

此外,谷歌计划在未来几周内通过Gemini API向部分开发者提供带工具和不带工具的Deep Think模型版本,以支持更广泛的应用开发。这一举措进一步强化了谷歌在AI推理领域的竞争力,为复杂问题解决提供了更高效的方案。

© 版权声明

相关文章