腾讯混元团队发布SRPO技术:解决AI文生图皮肤过油问题,真实感提升3倍

AI产品动态14小时前发布 AI视野

近日,腾讯混元团队联合香港中文大学(深圳)及清华大学发布了一项突破性技术——语义相对偏好优化(SRPO),旨在解决开源文生图模型Flux生成人像时出现的皮肤质感“过油”问题。该技术通过创新算法显著提升了AI生成图像的真实感,相关成果已在Hugging Face趋势榜登顶,社区量化版本下载量突破25K,GitHub Star数超700。

SRPO的核心创新在于引入“语义相对偏好”机制,通过在线调整奖励模型的优化目标,结合正向(如“真实感”)与负向控制提示词,有效中和了传统语义引导可能导致的奖励偏差。实验数据显示,该方法使人像真实度与美学评分提升超3倍,同时训练效率较传统方法提升75倍,仅需10分钟即可超越现有DanceGRPO技术。

针对Flux模型在高频信息上的过拟合问题,研究团队提出Direct-Align策略,通过向输入图像注入可控噪声并重建中间状态,实现了对生成轨迹早期阶段的优化。这一技术将重建误差降低至传统方法的1/10,尤其在处理初始时间步骤时表现出更强的稳定性。

目前,SRPO的完整训练代码及技巧已通过GitHub和Hugging Face开源。该技术的推出正值腾讯混元图像模型2.1发布之际,后者支持原生2K生图并登顶Hugging Face热度榜第三。行业观察人士指出,SRPO可能重塑数字艺术创作范式,其解决“塑料感”痛点的能力,为AI生成内容在影视、游戏等领域的应用开辟了新路径。

© 版权声明

相关文章