谷歌DeepMind发布第三代通用世界模型Genie 3，实现AGI重要突破

AI产品动态10个月前发布 AI视野

谷歌DeepMind于8月5日正式发布第三代通用世界模型Genie 3，标志着其在实现通用人工智能（AGI）道路上的重要突破。该模型通过文本提示即可实时生成高保真、可交互的虚拟环境，分辨率达720p并以24帧/秒的速率运行，同时能维持数分钟的环境一致性，显著超越前代产品的性能极限。

Genie 3的核心创新体现在三个方面：首先，其物理模拟引擎可精准还原水流、光影变化等自然现象，支持复杂场景如直升机在悬崖瀑布间的机动模拟；其次，模型突破时空限制，既能构建阿尔卑斯山等真实地理场景，也能生成古希腊历史环境或奇幻彩虹桥等虚构世界；最后，引入”可提示世界事件”功能，用户通过文本指令即可动态修改环境要素，例如在滑雪场景中实时添加鹿群互动。

技术层面，Genie 3采用流式处理架构解决传统生成模型的延迟问题，通过自回归逐帧生成机制配合长期一致性维护算法，使视觉记忆最长可追溯至一分钟前。相比Genie 2的360p分辨率与60秒运行限制，新一代模型在真实感与稳定性上实现质的飞跃。

目前该模型以研究预览形式向特定学术机构及创作者开放，重点应用于AI体感代理训练、自动驾驶模拟测试等领域。DeepMind研究主任Shlomi Fruchter指出，这种实时交互的世界建模能力是构建AGI系统的关键基础设施，未来或将拓展至教育、娱乐等更广泛场景。行业观察家认为，该技术为机器学习的具身智能研究提供了前所未有的仿真环境。

AI产品动态 # AGI # AI # DeepMind # Genie3 # 虚拟环境 # 通用人工智能

文章版权归作者所有，未经允许请勿转载。

谷歌DeepMind发布第三代通用世界模型Genie 3，实现AGI重要突破

OpenAI重磅发布两款开源大模型GPT-OSS-120B和GPT-OSS-20B，性能媲美专有模型

华为开源盘古大模型核心组件，推动全球AI生态发展

相关文章

中科院深圳先进院发布HYPIR图像复原大模型，1.7秒实现8K超高清修复

DuckDuckGo订阅服务升级：集成GPT-4o/Claude/Llama等AI模型并强化隐私保护

OpenAI宣布终止macOS版ChatGPT语音功能，2026年1月15日生效

华为发布新一代昇腾AI云服务，CloudMatrix384超节点架构引领AI算力新纪元

最新资讯

热门AI工具

热门资讯