谷歌发布Gemini 2.5系列AI模型：性能提升30%并支持百万级token处理

AI产品动态11个月前发布 AI视野

谷歌近日正式推出Gemini 2.5系列AI模型，标志着其在人工智能领域的技术突破。该系列包括Gemini 2.5 Pro、Gemini 2.5 Flash及轻量级预览版Gemini 2.5 Flash-Lite，于2025年6月17日至18日陆续发布，核心目标是通过架构革新实现推理性能30%的提升。

技术层面，新系列采用稀疏混合专家（MoE）架构，通过动态路由机制激活参数子集，使每个token仅调用约4-8个专家模块（占总参数3%-6%），在维持万亿级参数规模的同时显著降低计算成本。作为首个基于TPU v5p架构训练的模型系列，其利用多数据中心8960芯片pod进行同步数据并行训练，增强了大规模训练的稳定性。性能测试显示，该系列在HLE高难度智力测试、GPQA跨领域推理等基准中超越Claude Opus 4等竞品，其中Gemini 2.5 Pro在WebDevArena测试中以1443分刷新行业纪录。

应用特性方面，全系支持百万级token上下文窗口（输入104万/输出6.4万），并整合Google搜索、多模态输入及代码执行工具。Gemini 2.5 Flash-Lite作为性价比最优版本，在编码、科学推理等任务中延迟较前代降低22%，特别适配高吞吐场景如实时翻译。值得注意的是，新版本引入”推理预算”功能，允许用户自定义响应时长与计算成本平衡。

此次更新延续了谷歌5月I/O大会的技术路线，轻量级版本按计划于6月上市。行业观察指出，该系列通过增强模型透明度（如可视化思考过程）与领域适应性（法律、医学场景达专家级表现），进一步推动AI技术向实用化发展。目前模型已通过Google AI Studio等平台开放接入，预计未来数周内完成向稳定版的过渡。

文章版权归作者所有，未经允许请勿转载。

谷歌发布Gemini 2.5系列AI模型：性能提升30%并支持百万级token处理

松下发布多模态大模型OmniFlow，实现文本、图像与音频自由转换 | AI技术突破

MiniMax发布新一代AI视频生成模型Hailuo 02，实现原生1080P高清输出

相关文章

微软Copilot重大升级：直连谷歌生态，支持自然语言文档生成

豆包输入法iOS版正式上线：新增4种方言识别与情境感知引擎，支持智能场景切换

月之暗面发布开源思考模型Kimi K2 Thinking，国产大模型在Agent领域实现重大突破

Meta以近1亿美元收购AI语音公司PlayAI，强化语音AI技术布局

最新资讯

热门AI工具

热门资讯