谷歌发布Gemini 2.5 Flash-Lite模型：速度提升1.5倍，成本效益显著

AI产品动态11个月前发布 AI视野

谷歌于2025年6月正式推出Gemini 2.5 Flash-Lite模型，作为其Gemini 2.5系列的最新成员，该模型在完成大规模测试后全面开放，速度提升1.5倍，成为目前该系列中最快且最具成本效益的版本。这一进展标志着谷歌在大语言模型领域的持续创新和技术突破。

Gemini 2.5 Flash-Lite的核心特性包括默认关闭的思考模式，优先保证响应速度，延迟最低可达200毫秒。同时，开发者可通过reasoning_mode参数灵活启用深度思考功能，实现性能与精度的平衡。该模型继承了Gemini 2.5系列的全部核心能力，包括支持多模态输入、100万token的超长上下文处理，以及与谷歌搜索、代码执行等工具的无缝连接。

在性能方面，基准测试显示Gemini 2.5 Flash-Lite在代码编写、数学计算、科学推理等任务中全面超越前代2.0版本。特别是在翻译、分类等高并发、对延迟敏感的任务上表现尤为出色。根据测试数据，启用思考模式后，其数学能力提升至63.1%，长上下文任务处理能力提升至30.6%。

价格策略上，Gemini 2.5 Flash-Lite延续了该系列的高性价比定位，每百万输入/输出token定价为0.¹⁄₀.4美元，远低于同系列其他型号。这一优势使其特别适合高吞吐量、高成本效益的应用场景。

目前，开发者可通过Google AI Studio和Vertex AI平台访问Gemini 2.5 Flash-Lite的预览版本。谷歌CEO Sundar Pichai表示，该模型代表了谷歌在AI领域的最新突破，将为开发者提供更高效、更经济的工具选择。

文章版权归作者所有，未经允许请勿转载。

谷歌发布Gemini 2.5 Flash-Lite模型：速度提升1.5倍，成本效益显著

腾讯混元发布美术级3D生成大模型Hunyuan3D-PolyGen，建模效率提升70%

智元机器人发布灵犀X2-N：全球首款毫秒级轮足双形态商用机器人

相关文章

Adobe推出企业级AI定制服务AI Foundry，助力品牌解决内容规模化与合规难题

MiniMax发布Music 2.0音乐生成模型：人声合成突破，支持多种唱法与复杂演唱形式

法拉第未来拟更名“法拉第未来人工智能电动汽车公司”，全面转向AI+EV战略

昆仑万维Skywork AI推出网页复刻功能，数分钟快速生成网页原型

最新资讯

热门AI工具

热门资讯