谷歌发布Gemini 2.5系列AI模型:性能提升30%并支持百万级token处理

AI产品动态7小时前发布 AI视野

谷歌近日正式推出Gemini 2.5系列AI模型,标志着其在人工智能领域的技术突破。该系列包括Gemini 2.5 Pro、Gemini 2.5 Flash及轻量级预览版Gemini 2.5 Flash-Lite,于2025年6月17日至18日陆续发布,核心目标是通过架构革新实现推理性能30%的提升。

技术层面,新系列采用稀疏混合专家(MoE)架构,通过动态路由机制激活参数子集,使每个token仅调用约4-8个专家模块(占总参数3%-6%),在维持万亿级参数规模的同时显著降低计算成本。作为首个基于TPU v5p架构训练的模型系列,其利用多数据中心8960芯片pod进行同步数据并行训练,增强了大规模训练的稳定性。性能测试显示,该系列在HLE高难度智力测试、GPQA跨领域推理等基准中超越Claude Opus 4等竞品,其中Gemini 2.5 Pro在WebDevArena测试中以1443分刷新行业纪录。

应用特性方面,全系支持百万级token上下文窗口(输入104万/输出6.4万),并整合Google搜索、多模态输入及代码执行工具。Gemini 2.5 Flash-Lite作为性价比最优版本,在编码、科学推理等任务中延迟较前代降低22%,特别适配高吞吐场景如实时翻译。值得注意的是,新版本引入”推理预算”功能,允许用户自定义响应时长与计算成本平衡。

此次更新延续了谷歌5月I/O大会的技术路线,轻量级版本按计划于6月上市。行业观察指出,该系列通过增强模型透明度(如可视化思考过程)与领域适应性(法律、医学场景达专家级表现),进一步推动AI技术向实用化发展。目前模型已通过Google AI Studio等平台开放接入,预计未来数周内完成向稳定版的过渡。

© 版权声明

相关文章