清华大学与IDEA联合研发GUAVA框架：单张照片0.1秒生成3D化身，实时渲染破局元宇宙基建

清华大学与粤港澳大湾区数字经济研究院（IDEA）联合研发的GUAVA框架近日引发行业广泛关注。该技术通过单张照片即可在0.1秒内生成高保真上半身3D化身，渲染速度达每秒约50帧，相关成果已入选计算机视觉领域顶级会议ICCV 2025。

传统3D化身生成技术依赖多视角视频素材及针对个体的专门训练，耗时长达数小时至数天。GUAVA框架创新性地采用3D高斯模型与表达式人体模型EHM相结合的技术路径，不仅突破了对多角度拍摄的依赖，还能精准捕捉面部微表情和复杂手势动作。实验数据显示，其重建速度比主流方法提升两个数量级，在512×512分辨率下可实现实时动画渲染。

技术团队通过逆纹理映射技术准确预测高斯纹理，配合神经渲染器显著提升输出质量。与基于扩散模型的2D方法相比，GUAVA在身份一致性保持方面表现更优，同时解决了现有3D模型在表情捕捉上的局限性。开源代码的发布将加速该技术在影视特效、游戏开发、虚拟会议等场景的落地应用。

值得注意的是，该框架已实现亚秒级推理重建，用户仅需上传普通照片即可生成支持实时驱动的数字化身。在虚拟制片领域，该技术可将数字替身制作周期从传统数周缩短至分钟级；在远程协作场景中，能实现表情与动作的毫秒级同步传输。

目前研究团队已公开完整技术文档及源代码，相关论文及项目详情可通过学术平台获取。这项突破标志着单目视觉重建技术进入新阶段，为元宇宙基础设施建设提供了关键性技术支撑。

文章版权归作者所有，未经允许请勿转载。

清华大学与IDEA联合研发GUAVA框架：单张照片0.1秒生成3D化身，实时渲染破局元宇宙基建

Figure AI突破性进展：人形机器人Figure 02实现完全自主叠毛巾，柔性操作技术领先行业

微软开源VibeVoice-1.5B音频模型，突破90分钟长语音合成技术壁垒

相关文章

OpenAI调整Sora版权机制：从选择退出转向选择加入，应对名人形象伦理争议

DeepSeek推出V3.2-Exp实验模型：自研DSA稀疏注意力机制大幅提升长文本处理效率

阿里云通义千问发布AgentScope 1.0：开源智能体框架引领多智能体开发新突破

Hugging Face开源桌面机器人Reachy Mini开放订购，助力AI开发者创新

最新资讯

热门AI工具

热门资讯