盛数科技Vidu视频大模型全球内测:一键生成产品广告成片,AI视频商业化加速

AI产品动态23小时前发布 AI视野

近日,盛数科技(Shengshu Technology)旗下视频大模型Vidu正式面向全球开放内测,其核心功能“一键生成可直接投放的产品广告成片”引发行业广泛关注。该功能基于Vidu Q2模型的迭代升级,整合了多模态理解、主体一致性控制及高清音画同步等核心技术,标志着AI视频生成从技术探索迈向规模化商业应用

技术层面,Vidu通过U-ViT混合架构实现Diffusion模型与Transformer的深度融合,支持最多7张参考图像输入,确保多主体在跨场景视频中的形态一致性。最新升级的Q2版本强化了微表情生成与镜头运动模拟能力,结合48kHz高清音效同步技术,可自动生成包含推拉镜头、情感化表演的1080P广告短片。据内部测试显示,系统能根据商品特性智能匹配模板库中的光影效果与转场逻辑,平均生成时长缩短至3分钟以内。

商业化应用中,该功能已覆盖电商虚拟试穿、多语言广告本地化等场景。例如某国际美妆品牌通过输入产品静态图与文案,直接生成适配欧美、亚洲市场的差异化广告素材,制作成本降低70%。公司CEO陆毅航强调,Vidu的产业定位并非替代传统拍摄,而是通过“AI创作-人工微调”混合流程提升内容生产效率,目前教育、文旅等领域的定制化解决方案需求增长显著。

行业分析指出,Vidu的突破在于同时解决“生成效率”与“商业可用性”两大痛点。相比同类产品,其模板化输出更符合广告行业对品牌调性统一性的严苛要求,而音频同步、多主体控制等功能直接对标分镜头脚本替代需求。随着API接口的开放,预计将有更多MaaS(模型即服务)生态伙伴接入该平台。

© 版权声明

相关文章