谷歌Gemini 3正式发布：全面超越GPT-5.1，AI竞赛进入”执行力”新时代

AI产品动态6个月前发布 AI视野

谷歌于2025年11月18日正式推出新一代多模态大模型Gemini 3系列，该系列包含面向日常应用的Pro预览版和专注深度推理的Deep Think模式。作为谷歌迄今最强大的AI模型，Gemini 3在多项基准测试中全面超越OpenAI的GPT-5.1和Anthropic的Claude Sonnet 4.5，标志着AI竞赛进入以”执行力”为核心的新阶段。

性能表现方面，Gemini 3 Pro以1501的Elo评分登顶LMArena排行榜，在衡量博士级推理能力的”人类终极考试”中取得37.5%的得分率（未借助工具），GPQA Diamond测试准确率达91.9%，MathArena Apex数学测试则以23.4%的得分率刷新纪录。其多模态能力同样突出，Video-MMMU视频理解测试得分87.6%，SimpleQA事实核查准确率72.1%，展现处理跨学科复杂问题的可靠能力。Deep Think模式表现更为惊人，相同测试中得分率提升至41.0%，GPQA Diamond达93.8%，启用代码执行功能的ARC-AGI-2测试取得45.1%的突破性成绩。

技术革新上，Gemini 3首创”生成式界面”(GenUI)，能根据用户需求动态生成交互式3D模型等可视化内容。其独家”Vibe Coding”技术可捕捉开发者的模糊意图，通过草图或概念直接生成全功能应用。配套发布的Google Antigravity开发平台将AI升级为自主协作伙伴，支持智能体直接操作编辑器、终端和浏览器，现场演示中成功独立完成航班追踪应用的端到端开发。

商业化部署方面，Gemini 3 Pro已全面接入Google搜索、Android系统及Cloud服务，用户可通过自然语言交互完成学习创作等任务。Deep Think模式将在安全测试后向Google AI Ultra订阅用户开放。据官方数据，Gemini应用月活用户超6.5亿，1300万开发者已将其纳入工作流程。此次发布距离前代Gemini 2.5仅七个月，被视作谷歌重夺AI领导地位的关键举措。

文章版权归作者所有，未经允许请勿转载。

谷歌Gemini 3正式发布：全面超越GPT-5.1，AI竞赛进入”执行力”新时代

AI视野：每日AI资讯速递 | 2025-11-19

阿里千问APP上线两天冲入App Store前三，AI生活入口战略初显成效

相关文章

OpenAI推出青少年安全防护措施：新增年龄预测与家长监管功能

国产AI大模型Kimi K2 Thinking接入Perplexity，多项性能超越GPT-5

OpenAI Sora重大更新：视频编辑器+安卓版+社交功能即将上线

太空AI算力竞赛白热化：英伟达H100与谷歌TPU相继升空，近地轨道成科技巨头新战场

最新资讯

热门AI工具

热门资讯