谷歌近日发布Gemini系列大模型能耗评估报告,其中文本生成任务单次响应平均能耗为0.24瓦时,同时推出轻量级模型Gemma 3 270M版本。这一进展标志着该公司在平衡AI性能与能源效率方面取得重要突破。
作为谷歌DeepMind实验室开发的多模态大语言模型,Gemini系列自2023年12月发布以来持续迭代。最新稳定版本Gemini 2.5 Pro于2025年6月完成大规模测试,具备处理100万token上下文窗口的能力,在Chatbot Arena竞技场以1443分保持领先地位。此次能耗报告显示,该系列模型在保持顶尖推理能力的同时,通过架构优化显著降低能源消耗。
技术文档显示,Gemini 2.5 Pro采用改进的Transformer解码器架构,其多模态处理能力支持同时解析文本、图像、音频及视频数据。在数学推理测试中,该模型在AIME 2025测评中取得86.7%的准确率,而最新推出的轻量版Gemma 3 270M在保持70%核心功能的前提下,能耗较标准版降低约40%。
谷歌工程师透露,Gemma 3系列专为移动端部署设计,通过量化压缩技术将模型体积控制在4.6MB以内,目前已适配Android平台。实际测试表明,该版本在图像识别、实时翻译等场景下响应延迟低于800毫秒,特别适合需要快速响应的边缘计算场景。
随着全球对可持续计算的关注度提升,谷歌此次同步公开的能耗数据为行业树立了透明度标杆。分析人士指出,0.24瓦时的文本生成能耗相当于传统搜索查询能耗的1.5倍,但考虑到其复杂的多模态处理能力,这一数字仍处于同类产品的能效领先水平。公司表示,后续将通过硬件协同设计进一步优化能源使用效率。
© 版权声明
文章版权归作者所有,未经允许请勿转载。