谷歌近日正式推出Gemini 2.5 Flash-Lite稳定版本,标志着该轻量级AI模型结束预览阶段,全面进入商业化应用。作为Gemini 2.5系列中成本效益最优的成员,该模型在保持百万token上下文处理能力的同时,实现了1.5倍于前代的速度提升,输入输出定价分别为每百万token 0.10美元和0.40美元,音频处理成本降幅达40%。
技术特性方面,Gemini 2.5 Flash-Lite采用创新的token处理架构,支持跨文档分析与多模态数据处理。实际测试显示,其可在数秒内完成数百页文档的实时处理,并动态生成可交互摘要。用户点击任意摘要段落时,模型能即时重新解析全文并输出新内容,还可根据需求生成解释、图表或特定数据提取。在LMArena基准测试中,该模型文本综合排名第12位,其中创意写作位列前三。
开发者现可通过指定模型名称”gemini-2.5-flash-lite”调用服务,原预览版别名将于8月25日停用。谷歌强调该版本特别适合高吞吐量场景,已在搜索引擎等核心产品中部署定制版本,其低延迟特性在翻译、分类等实时任务中表现突出。此次更新延续了Gemini系列对”速度-成本-性能”三角的优化策略,为企业在AI应用落地阶段提供了更具性价比的选择。
© 版权声明
文章版权归作者所有,未经允许请勿转载。