谷歌Gemini 2.5 Flash-Lite正式发布：轻量级AI模型全面商业化

AI产品动态10个月前发布 AI视野

谷歌近日正式推出Gemini 2.5 Flash-Lite稳定版本，标志着该轻量级AI模型结束预览阶段，全面进入商业化应用。作为Gemini 2.5系列中成本效益最优的成员，该模型在保持百万token上下文处理能力的同时，实现了1.5倍于前代的速度提升，输入输出定价分别为每百万token 0.10美元和0.40美元，音频处理成本降幅达40%。

技术特性方面，Gemini 2.5 Flash-Lite采用创新的token处理架构，支持跨文档分析与多模态数据处理。实际测试显示，其可在数秒内完成数百页文档的实时处理，并动态生成可交互摘要。用户点击任意摘要段落时，模型能即时重新解析全文并输出新内容，还可根据需求生成解释、图表或特定数据提取。在LMArena基准测试中，该模型文本综合排名第12位，其中创意写作位列前三。

开发者现可通过指定模型名称”gemini-2.5-flash-lite”调用服务，原预览版别名将于8月25日停用。谷歌强调该版本特别适合高吞吐量场景，已在搜索引擎等核心产品中部署定制版本，其低延迟特性在翻译、分类等实时任务中表现突出。此次更新延续了Gemini系列对”速度-成本-性能”三角的优化策略，为企业在AI应用落地阶段提供了更具性价比的选择。

文章版权归作者所有，未经允许请勿转载。

谷歌Gemini 2.5 Flash-Lite正式发布：轻量级AI模型全面商业化

Latent Labs推出生物编程AI模型LatentX，革新蛋白质设计领域

iOS 26 Beta 4重新启用智能通知摘要功能，AI优化新闻娱乐通知管理

相关文章

开源AI绘画工具PromptFill上线：可视化交互设计降低Prompt创作门槛

腾讯混元发布美术级3D生成大模型Hunyuan3D-PolyGen，建模效率提升70%

谷歌Gemini嵌入模型登顶MTEB排行榜：性能与成本双突破

阿里云百炼平台语音识别模型SenseVoice-V1将于2026年3月终止服务

最新资讯

热门AI工具

热门资讯