腾讯开源混元世界模型1.1:单卡秒级3D重建,降低内容生成门槛

腾讯于2025年10月22日正式开源混元世界模型1.1(WorldMirror),标志着3D重建技术进入全新阶段。作为业界首个统一的前馈式端到端3D重建大模型,该版本突破性地支持多视图图像、视频输入及多模态先验融合,仅需单张消费级显卡即可实现秒级高精度推理,显著降低3D内容生成门槛。

技术突破与核心功能
混元世界模型1.1解决了1.0版本仅支持文本或单图输入的局限,首次实现多模态输入(包括相机参数、深度信息)与多任务输出(点云、深度图、表面法线、新视角合成等)的统一架构。其创新性体现在三方面:
1. 多模态兼容性:支持用户上传多角度照片或视频片段,结合几何先验数据提升重建稳定性;
2. 高效推理能力:在单卡环境下完成端到端3D高斯泼溅(3DGS)重建,生成速度达秒级,几何精度超越当前开源SOTA;
3. 全流程整合:将传统需分步处理的3D重建任务压缩至单一模型,输出结果可直接用于游戏开发、VR场景构建及数字孪生应用。

实际应用表现
测试显示,模型对动画风格、中华风建筑及航拍场景均能实现细节还原。例如,输入欧洲小镇街角视频后,模型可快速生成可漫游的3D环境,其纹理细节与光影效果接近专业手工建模水准。开源生态方面,腾讯同步释放了GitHub代码库、Hugging Face模型及在线Demo,开发者可通过标准化文档快速部署,普通用户亦可直接上传素材体验实时渲染。

行业影响
此次升级将加速3D内容生产民主化,尤其在游戏、虚拟拍摄和元宇宙领域。混元团队表示,未来将持续优化资源效率,推动社区协作创新。技术报告与完整项目资源已通过腾讯官方平台公开。

© 版权声明

相关文章