谷歌Veo 3.1正式发布:原生音频集成+创作流程优化,直面Sora 2竞争

北京时间10月16日,谷歌正式推出视频生成模型Veo 3.1及轻量版Veo 3.1 Fast,距离OpenAI发布Sora 2仅隔半月,标志着两大科技巨头在AI视频生成领域的竞争进入白热化阶段。此次更新虽以版本号显示为迭代升级,但功能层面实现了多项突破,尤其在原生音频集成与创作流程优化上表现突出。

核心功能升级
Veo 3.1首次在全功能中整合音频生成能力,包括环境音效、动作声及氛围配乐,结束了此前需手动后期添加音轨的历史。其”素材转视频”功能支持用户上传多张参考图像定义角色与风格,模型自动合成带音效的完整场景;”帧转视频”则通过首尾帧生成中间过渡动画,特别适用于艺术性转场需求。此外,”延展”功能可基于已有片段生成超过一分钟的连贯内容,解决AI视频连贯性难题。

技术参数与市场定位
该模型支持720p与1080p分辨率输出,单次生成时长可选4秒、6秒或8秒,通过延展功能理论最长可达148秒。尽管在最大时长和分辨率上略逊于Sora 2的25秒4K输出,但Veo 3.1凭借开放API访问和免费层级的AI Studio配额,显著降低创作者门槛。实测显示,其光影效果与生成速度优于竞品,但在物理模拟和自动分镜精度上仍有差距。

生态整合与用户反馈
谷歌已将Veo 3.1部署至视频编辑平台Flow、Gemini应用及Vertex AI企业平台。数据显示,自5月Flow上线以来用户已创作2.75亿个视频。新增的”插入元素”编辑功能可自动处理新增对象的阴影与光线融合,即将推出的对象移除功能将进一步增强后期灵活性。

行业观察人士指出,此次更新虽未实现技术代际跨越,但通过音频与编辑功能的深度整合,强化了谷歌在创意工具链的闭环优势。随着OpenAI同日宣布Sora 2开放15-25秒视频生成权限,双方在生成时长、开放策略等维度的差异化竞争将持续升级。

© 版权声明

相关文章