华为清华联合发布WorldGrow世界模型,单卡30分钟生成272㎡高精度数字空间

华为清华大学近日联合发布世界模型WorldGrow,该模型在室内场景生成领域取得突破性进展,仅需单卡30分钟即可生成272平方米的高精度数字空间。这一技术进展标志着华为在世界模型应用场景的又一次拓展,此前其盘古世界模型已在火星探测、智能驾驶等领域展现出多模态建模能力。

技术架构上,WorldGrow延续了华为在视觉中心化世界模型的技术路线。不同于依赖语言中介的VLA(视觉语言行为)方案,该模型直接建立环境感知与行动决策的映射关系,这与华为智能汽车解决方案BU CEO靳玉志强调的WA(世界行为模型)技术路线一脉相承。公开资料显示,华为早在2024年与浙江大学合作研发的Drive-OccWorld模型中,就已实现通过历史图像帧预测未来两秒环境状态的能力。

在工程实现层面,WorldGrow展现出三大核心优势:一是生成效率较传统方案提升显著,单卡即可完成大规模场景建模;二是物理规则模拟精度达到工业级标准,能够准确还原材质反射、光影交互等细节;三是支持多模态数据输出,可同步生成点云数据与纹理贴图。这些特性使其在建筑可视化、智能家居布局等领域具备直接应用价值。

值得关注的是,世界模型技术正在全球范围内形成竞争格局。特斯拉在2023年CVPR大会上已展示基于扩散模型的早期研究成果,而国内蔚来、小鹏等车企也分别推出NWM和世界基座模型。华为此次选择与清华大学合作,强化了在学术研究端的布局,其技术路线更侧重模块化子系统整合,通过GOD 2.0网络与拓扑推理网络的协同实现环境理解。

行业分析指出,世界模型已成为突破自动驾驶训练数据瓶颈的关键技术。传统路采方式成本高昂且难以覆盖极端场景,而WorldGrow这类技术可生成密度达真实世界1000倍的训练场景。广汽集团此前采用华为云盘古模型后,已实现复杂场景两日内完成迭代的研发效率。

随着WorldGrow的发布,华为在世界模型领域形成”云端引擎+终端模型”的完整技术栈。该模型既可部署于云端构建数字孪生环境,也能嵌入终端设备实现实时决策,这种双重能力使其在具身智能、工业仿真等场景具备独特优势。清华大学计算机系参与项目的团队表示,下一步将重点优化模型在动态物体交互方面的预测准确性。

© 版权声明

相关文章