腾讯混元开源HunyuanWorld-Voyager:全球首个原生3D重建超长漫游世界模型

AI产品动态2个月前发布 AI视野

腾讯混元团队于2025年9月2日正式发布并开源HunyuanWorld-Voyager(简称混元Voyager),这是业界首个支持原生3D重建的超长漫游世界模型。该模型在斯坦福大学李飞飞团队主导的WorldScore排行榜中位列综合能力第一,尤其在视频生成与3D重建任务中表现突出,超越现有开源方法。

混元Voyager的核心突破在于解决了传统3D生成模型在长距离漫游和视角一致性上的局限。通过引入RGB-D视频联合建模与空间缓存机制,模型能够根据单张输入图像和用户设定的相机轨迹,生成结构连续、深度一致的点云视频,并直接导出为标准3D格式(如点云、mesh)。这一技术避免了传统后处理工具(如Colmap)的精度损失,实现了“边走边记忆”的动态场景扩展能力,显著提升了虚拟现实、游戏开发等领域的场景构建效率。

作为混元世界模型1.0的官方扩展,Voyager进一步提升了复杂场景的生成质量,支持风格化编辑、局部重绘等控制功能。其3D输入-3D输出的特性与1.0版本高度适配,可扩展原模型的漫游范围。此外,模型还支持视频场景重建、3D物体纹理生成、深度估计等多元应用,为开发者提供了一站式解决方案。

腾讯混元团队在近两个月内连续迭代3D世界模型技术:7月开源兼容传统CG管线的1.0版本,8月推出适配消费级显卡的Lite版,此次Voyager的发布进一步填补了长距离生成的技术空白。目前,模型代码及技术报告已在GitHub、Hugging Face等平台开放,下载量位居开源社区前列。不过,实际部署中仍需考虑显存消耗与商用版权等细节问题,部分开发者反馈需进一步优化资源效率。

© 版权声明

相关文章