谷歌于2025年11月18日正式推出新一代多模态大模型Gemini 3系列,该系列包含面向日常应用的Pro预览版和专注深度推理的Deep Think模式。作为谷歌迄今最强大的AI模型,Gemini 3在多项基准测试中全面超越OpenAI的GPT-5.1和Anthropic的Claude Sonnet 4.5,标志着AI竞赛进入以”执行力”为核心的新阶段。
性能表现方面,Gemini 3 Pro以1501的Elo评分登顶LMArena排行榜,在衡量博士级推理能力的”人类终极考试”中取得37.5%的得分率(未借助工具),GPQA Diamond测试准确率达91.9%,MathArena Apex数学测试则以23.4%的得分率刷新纪录。其多模态能力同样突出,Video-MMMU视频理解测试得分87.6%,SimpleQA事实核查准确率72.1%,展现处理跨学科复杂问题的可靠能力。Deep Think模式表现更为惊人,相同测试中得分率提升至41.0%,GPQA Diamond达93.8%,启用代码执行功能的ARC-AGI-2测试取得45.1%的突破性成绩。
技术革新上,Gemini 3首创”生成式界面”(GenUI),能根据用户需求动态生成交互式3D模型等可视化内容。其独家”Vibe Coding”技术可捕捉开发者的模糊意图,通过草图或概念直接生成全功能应用。配套发布的Google Antigravity开发平台将AI升级为自主协作伙伴,支持智能体直接操作编辑器、终端和浏览器,现场演示中成功独立完成航班追踪应用的端到端开发。
商业化部署方面,Gemini 3 Pro已全面接入Google搜索、Android系统及Cloud服务,用户可通过自然语言交互完成学习创作等任务。Deep Think模式将在安全测试后向Google AI Ultra订阅用户开放。据官方数据,Gemini应用月活用户超6.5亿,1300万开发者已将其纳入工作流程。此次发布距离前代Gemini 2.5仅七个月,被视作谷歌重夺AI领导地位的关键举措。
© 版权声明
文章版权归作者所有,未经允许请勿转载。