清华大学与IDEA联合研发GUAVA框架:单张照片0.1秒生成3D化身,实时渲染破局元宇宙基建

AI产品动态16小时前发布 AI视野

清华大学与粤港澳大湾区数字经济研究院(IDEA)联合研发的GUAVA框架近日引发行业广泛关注。该技术通过单张照片即可在0.1秒内生成高保真上半身3D化身,渲染速度达每秒约50帧,相关成果已入选计算机视觉领域顶级会议ICCV 2025。

传统3D化身生成技术依赖多视角视频素材及针对个体的专门训练,耗时长达数小时至数天。GUAVA框架创新性地采用3D高斯模型与表达式人体模型EHM相结合的技术路径,不仅突破了对多角度拍摄的依赖,还能精准捕捉面部微表情和复杂手势动作。实验数据显示,其重建速度比主流方法提升两个数量级,在512×512分辨率下可实现实时动画渲染。

技术团队通过逆纹理映射技术准确预测高斯纹理,配合神经渲染器显著提升输出质量。与基于扩散模型的2D方法相比,GUAVA在身份一致性保持方面表现更优,同时解决了现有3D模型在表情捕捉上的局限性。开源代码的发布将加速该技术在影视特效、游戏开发、虚拟会议等场景的落地应用。

值得注意的是,该框架已实现亚秒级推理重建,用户仅需上传普通照片即可生成支持实时驱动的数字化身。在虚拟制片领域,该技术可将数字替身制作周期从传统数周缩短至分钟级;在远程协作场景中,能实现表情与动作的毫秒级同步传输。

目前研究团队已公开完整技术文档及源代码,相关论文及项目详情可通过学术平台获取。这项突破标志着单目视觉重建技术进入新阶段,为元宇宙基础设施建设提供了关键性技术支撑。

© 版权声明

相关文章