盛数科技Vidu视频大模型全球内测：一键生成产品广告成片，AI视频商业化加速

AI产品动态5个月前发布 AI视野

近日，盛数科技（Shengshu Technology）旗下视频大模型Vidu正式面向全球开放内测，其核心功能“一键生成可直接投放的产品广告成片”引发行业广泛关注。该功能基于Vidu Q2模型的迭代升级，整合了多模态理解、主体一致性控制及高清音画同步等核心技术，标志着AI视频生成从技术探索迈向规模化商业应用。

技术层面，Vidu通过U-ViT混合架构实现Diffusion模型与Transformer的深度融合，支持最多7张参考图像输入，确保多主体在跨场景视频中的形态一致性。最新升级的Q2版本强化了微表情生成与镜头运动模拟能力，结合48kHz高清音效同步技术，可自动生成包含推拉镜头、情感化表演的1080P广告短片。据内部测试显示，系统能根据商品特性智能匹配模板库中的光影效果与转场逻辑，平均生成时长缩短至3分钟以内。

商业化应用中，该功能已覆盖电商虚拟试穿、多语言广告本地化等场景。例如某国际美妆品牌通过输入产品静态图与文案，直接生成适配欧美、亚洲市场的差异化广告素材，制作成本降低70%。公司CEO陆毅航强调，Vidu的产业定位并非替代传统拍摄，而是通过“AI创作-人工微调”混合流程提升内容生产效率，目前教育、文旅等领域的定制化解决方案需求增长显著。

行业分析指出，Vidu的突破在于同时解决“生成效率”与“商业可用性”两大痛点。相比同类产品，其模板化输出更符合广告行业对品牌调性统一性的严苛要求，而音频同步、多主体控制等功能直接对标分镜头脚本替代需求。随着API接口的开放，预计将有更多MaaS（模型即服务）生态伙伴接入该平台。

文章版权归作者所有，未经允许请勿转载。

盛数科技Vidu视频大模型全球内测：一键生成产品广告成片，AI视频商业化加速

阶跃星辰发布Step-GUI系列AI Agent，开启图形界面智能体规模化应用时代

百度健康发布行业首款可控AI创作平台Dr.Flow，医疗内容创作效率提升60倍

相关文章

阿里Qwen3-Omni-Flash-2025-12-01发布：原生全模态大模型实现音视频实时流式输出，支持个性化AI人设定制

微软发布突破性医疗AI工具MAI-DxO，诊断准确率超人类医生4倍

Meta虚拟化身系统重大更新：AI驱动个性化定制功能全面升级

Anthropic推出Claude AI学习模式，革新教育科技市场

最新资讯

热门AI工具

热门资讯