微软近日开源了其最新AI工具TRELLIS.2,这是一款拥有40亿参数的大型3D生成模型,专为高保真图像到3D转换而设计。该模型的推出标志着3D建模技术的一次重大突破,为游戏开发、虚拟现实、工业设计等领域提供了强大的技术支持。
TRELLIS.2基于原生3D VAE架构,能够生成高达1536³分辨率的PBR(物理基础渲染)纹理资产,并具备16倍空间压缩能力。这一特性使得模型在保持高保真度的同时,实现了高效且可扩展的资产生成。该模型的核心创新在于采用了名为O-Voxel的全新”无场”稀疏体素结构,能够重建和生成具有复杂拓扑、锐利特征及完整PBR材质的任意3D资产。
在性能方面,TRELLIS.2展现出卓越的效率和保真度。测试数据显示,在英伟达H100 GPU上,生成512³分辨率的3D模型仅需约3秒。模型通过16倍空间下采样的稀疏3D VAE将资产编码成紧凑的潜在空间,显著提升了生成效率。
TRELLIS.2还突破了传统3D建模的限制,能够稳健处理复杂结构而不会造成有损转换。此外,该工具支持对表面属性进行全方位建模,包括基本颜色、粗糙度、金属度和不透明度,从而实现照片级真实感渲染和透明度支持。数据处理流程的简化使得即时转换成为可能,完全无需额外的渲染和优化步骤。
该工具支持生成兼容主流3D引擎(如Blender、Unity、Unreal)的.glb格式文件,为电商等应用场景提供了便利。商家仅需上传商品照片,即可快速获得可直接用于线上展示的高质量3D资产,大大优化了3D内容生产流程。
微软此次开源TRELLIS.2,预计将推动3D建模技术的进一步发展,为开发者和设计师提供更强大的创作工具,拓展创意实现的边界。
© 版权声明
文章版权归作者所有,未经允许请勿转载。