谷歌Gemini大模型能耗报告发布：文本生成单次仅0.24瓦时，Gemma 3轻量版同步亮相

谷歌近日发布Gemini系列大模型能耗评估报告，其中文本生成任务单次响应平均能耗为0.24瓦时，同时推出轻量级模型Gemma 3 270M版本。这一进展标志着该公司在平衡AI性能与能源效率方面取得重要突破。

作为谷歌DeepMind实验室开发的多模态大语言模型，Gemini系列自2023年12月发布以来持续迭代。最新稳定版本Gemini 2.5 Pro于2025年6月完成大规模测试，具备处理100万token上下文窗口的能力，在Chatbot Arena竞技场以1443分保持领先地位。此次能耗报告显示，该系列模型在保持顶尖推理能力的同时，通过架构优化显著降低能源消耗。

技术文档显示，Gemini 2.5 Pro采用改进的Transformer解码器架构，其多模态处理能力支持同时解析文本、图像、音频及视频数据。在数学推理测试中，该模型在AIME 2025测评中取得86.7%的准确率，而最新推出的轻量版Gemma 3 270M在保持70%核心功能的前提下，能耗较标准版降低约40%。

谷歌工程师透露，Gemma 3系列专为移动端部署设计，通过量化压缩技术将模型体积控制在4.6MB以内，目前已适配Android平台。实际测试表明，该版本在图像识别、实时翻译等场景下响应延迟低于800毫秒，特别适合需要快速响应的边缘计算场景。

随着全球对可持续计算的关注度提升，谷歌此次同步公开的能耗数据为行业树立了透明度标杆。分析人士指出，0.24瓦时的文本生成能耗相当于传统搜索查询能耗的1.5倍，但考虑到其复杂的多模态处理能力，这一数字仍处于同类产品的能效领先水平。公司表示，后续将通过硬件协同设计进一步优化能源使用效率。

文章版权归作者所有，未经允许请勿转载。

谷歌Gemini大模型能耗报告发布：文本生成单次仅0.24瓦时，Gemma 3轻量版同步亮相

可灵AI 2.1首尾帧功能重磅发布，视频生成效果提升235%突破技术瓶颈

苹果与谷歌洽谈Gemini合作，下一代Siri或将迎来AI革命

相关文章

谷歌向18亿Gmail用户开放Vids AI视频编辑功能，零基础制作视频仅需45分钟

百度开源文心大模型4.5系列，推动国产AI技术生态建设

OpenAI发布Agent Builder工具：可视化构建AI智能体，开发门槛大幅降低

百度文心APP推出’魔法漫画’功能：一句话生成AI连载漫画，5分钟创作8页内容

最新资讯

热门AI工具

热门资讯