腾讯混元世界模型1.5正式开源:国内首个实时交互式3D世界建模技术突破

AI产品动态24小时前发布 AI视野

腾讯混元世界模型1.5于2025年12月17日正式发布并开源,标志着国内实时交互式世界建模技术取得重大突破。该模型支持用户通过文本描述或单张图片输入,实时生成可自由探索的3D交互场景,成为首个开放体验的国产实时世界模型。

技术层面,混元世界模型1.5创新性地采用WorldPlay自回归扩散架构,通过Next-Frames-Prediction视觉自回归训练实现三大核心能力:一是以24FPS速率生成720P高清视频流,依托原创Context Forcing蒸馏方案实现实时交互;二是通过重构记忆机制(Reconstituted Memory)保持分钟级3D几何一致性,解决空间记忆难题;三是支持多视角切换、文本触发事件等多样化交互模式。模型还可将场景导出为可复用的3D点云数据。

此次开源的实时世界模型框架为业界首个全链路解决方案,涵盖数据构建、训练优化到流式推理部署全流程。关键技术包括双分支动作表征系统、上下文记忆重构机制以及基于3D奖励的强化学习后训练模块。据技术报告披露,团队通过自动化3D场景渲染流程构建高质量训练数据集,显著提升模型在游戏开发、影视预演等场景的泛化能力。

腾讯混元团队自2025年7月发布1.0版本以来持续迭代,此次升级在实时性与一致性平衡方面取得突破。目前该模型已开放官网体验通道,为AI内容生成、具身智能研究等领域提供新的技术基础设施。

© 版权声明

相关文章