谷歌于2025年6月正式推出Gemini 2.5 Flash-Lite模型,作为其Gemini 2.5系列的最新成员,该模型在完成大规模测试后全面开放,速度提升1.5倍,成为目前该系列中最快且最具成本效益的版本。这一进展标志着谷歌在大语言模型领域的持续创新和技术突破。
Gemini 2.5 Flash-Lite的核心特性包括默认关闭的思考模式,优先保证响应速度,延迟最低可达200毫秒。同时,开发者可通过reasoning_mode参数灵活启用深度思考功能,实现性能与精度的平衡。该模型继承了Gemini 2.5系列的全部核心能力,包括支持多模态输入、100万token的超长上下文处理,以及与谷歌搜索、代码执行等工具的无缝连接。
在性能方面,基准测试显示Gemini 2.5 Flash-Lite在代码编写、数学计算、科学推理等任务中全面超越前代2.0版本。特别是在翻译、分类等高并发、对延迟敏感的任务上表现尤为出色。根据测试数据,启用思考模式后,其数学能力提升至63.1%,长上下文任务处理能力提升至30.6%。
价格策略上,Gemini 2.5 Flash-Lite延续了该系列的高性价比定位,每百万输入/输出token定价为0.1⁄0.4美元,远低于同系列其他型号。这一优势使其特别适合高吞吐量、高成本效益的应用场景。
目前,开发者可通过Google AI Studio和Vertex AI平台访问Gemini 2.5 Flash-Lite的预览版本。谷歌CEO Sundar Pichai表示,该模型代表了谷歌在AI领域的最新突破,将为开发者提供更高效、更经济的工具选择。
© 版权声明
文章版权归作者所有,未经允许请勿转载。