Luma AI发布全球首款多模态推理视频模型Ray3,支持4K HDR生成与智能修正

近日,人工智能视觉技术公司Luma AI正式推出全球首款具备多模态推理能力的视频生成模型Ray3,该产品已通过Dream Machine平台向用户开放,并与Adobe达成深度合作,将集成至Firefly及Creative Cloud Pro工作流中。这一突破性技术标志着AI视频生成从基础内容创作向智能化评估迭代的演进。

Ray3的核心竞争力在于其独特的推理机制。与传统生成模型不同,该技术能对输出内容进行自主评估,通过回溯检查机制优化动作序列的连贯性与物理合理性。Luma AI首席执行官阿米特·简透露,系统可识别生成缺陷并主动标注修改建议,例如在角色一致性或光线交互等关键帧处提供视觉注释工具,支持用户通过草图绘制直接调整画面元素。测试显示,该功能使复杂场景的错误率降低约40%。

技术规格方面,Ray3成为业内首个支持16位HDR视频生成的模型,兼容10-12位色深及EXR专业格式输出,可实现标准动态范围(SDR)向高动态范围的转换。其创新的双阶段处理流程包含草稿模式与高保真模式:前者能以五倍速生成20秒低分辨率预览(耗时2-5分钟),后者可升级至4K HDR成品。在渲染人群、反射及运动模糊等传统难点上,模型展现出接近影视级的效果。

商业应用层面,Ray3已吸引Monks UK等广告公司及电影制作团队采用。Adobe确认10月1日前将为Creative Cloud Pro用户开放无限制生成权限。不过需注意的是,当前版本暂不支持音频合成功能,这使其在完整叙事创作中存在一定局限。

行业观察人士指出,Ray3的推出加剧了AI视频工具的市场竞争。尽管面临艺术家团体关于训练数据合法性的诉讼争议,其推理能力与专业级输出仍被视为迈向智能创作的关键一步。随着谷歌Veo 3等竞品的迭代,该领域技术壁垒正快速提升。

© 版权声明

相关文章