腾讯混元图像3.0登顶全球文生图榜首,元宝App可一键生成专业级图像

腾讯混元图像3.0近日正式登陆元宝App,用户通过切换“Hunyuan”模型即可生成统一风格的内容。该模型支持表情包组图、四格漫画、人像写真、纪实摄影及设计配图等多种创作形式,进一步降低了专业级图像生成的门槛。

这一进展建立在混元图像3.0此前取得的突破性成绩基础上。10月5日,国际权威评测平台LMArena发布的文生图榜单显示,该模型在全球26款大模型的用户盲测中位列第一,被评为最佳综合文生图模型与最佳开源文生图模型。评测机构特别指出,其生成质量已超越包括Gemini 2.5 Flash Image Preview在内的国际主流模型。

技术层面,混元图像3.0采用MoE架构与Transfusion方法结合的创新设计,总参数量达800亿,推理时激活130亿参数。其核心优势在于多模态深度融合能力,可处理千字级复杂语义,并实现精确的文字渲染。作为全球首个开源商用级原生多模态生图模型,该版本已于9月28日开放完整源代码和权重文件,支持2048×2048超高分辨率输出,在手部细节、光影处理等传统难点上准确率提升35%。

目前,模型已广泛应用于文创、电商、游戏开发等领域。公开案例显示,某国潮服饰品牌通过输入“明代仕女卖卫衣”等提示词,可实现十秒出图;部分游戏厂商将场景生成效率提升80%,显著缩短开发周期。腾讯混元团队透露,图生视频功能已进入内测阶段,预计2026年第一季度开源。

随着AI图像生成技术进入产业化落地阶段,混元图像3.0的商用化进程或将重塑设计、摄影等行业的成本结构。其开源策略也加速了技术普惠,开发者可通过元宝App等平台快速接入相关能力。

© 版权声明

相关文章