谷歌Veo 3.1正式发布：原生音频集成+创作流程优化，直面Sora 2竞争

AI产品动态6个月前发布 AI视野

北京时间10月16日，谷歌正式推出视频生成模型Veo 3.1及轻量版Veo 3.1 Fast，距离OpenAI发布Sora 2仅隔半月，标志着两大科技巨头在AI视频生成领域的竞争进入白热化阶段。此次更新虽以版本号显示为迭代升级，但功能层面实现了多项突破，尤其在原生音频集成与创作流程优化上表现突出。

核心功能升级
Veo 3.1首次在全功能中整合音频生成能力，包括环境音效、动作声及氛围配乐，结束了此前需手动后期添加音轨的历史。其”素材转视频”功能支持用户上传多张参考图像定义角色与风格，模型自动合成带音效的完整场景；”帧转视频”则通过首尾帧生成中间过渡动画，特别适用于艺术性转场需求。此外，”延展”功能可基于已有片段生成超过一分钟的连贯内容，解决AI视频连贯性难题。

技术参数与市场定位
该模型支持720p与1080p分辨率输出，单次生成时长可选4秒、6秒或8秒，通过延展功能理论最长可达148秒。尽管在最大时长和分辨率上略逊于Sora 2的25秒4K输出，但Veo 3.1凭借开放API访问和免费层级的AI Studio配额，显著降低创作者门槛。实测显示，其光影效果与生成速度优于竞品，但在物理模拟和自动分镜精度上仍有差距。

生态整合与用户反馈
谷歌已将Veo 3.1部署至视频编辑平台Flow、Gemini应用及Vertex AI企业平台。数据显示，自5月Flow上线以来用户已创作2.75亿个视频。新增的”插入元素”编辑功能可自动处理新增对象的阴影与光线融合，即将推出的对象移除功能将进一步增强后期灵活性。

行业观察人士指出，此次更新虽未实现技术代际跨越，但通过音频与编辑功能的深度整合，强化了谷歌在创意工具链的闭环优势。随着OpenAI同日宣布Sora 2开放15-25秒视频生成权限，双方在生成时长、开放策略等维度的差异化竞争将持续升级。

文章版权归作者所有，未经允许请勿转载。

谷歌Veo 3.1正式发布：原生音频集成+创作流程优化，直面Sora 2竞争

OpenAI推出ChatGPT记忆自动管理功能，彻底解决内存已满问题

X平台全面升级Grok AI推荐系统，内容分发效率将提升40%

相关文章

宁夏启动“人工智能+实体经济”深度赋能工程，2027年算力目标80万PFLOPS

苹果联手谷歌！Siri将搭载Gemini 2.5 Pro实现三大突破

谷歌将NotebookLM深度整合至Gemini平台，AI助手迈向个性化智能协作新时代

智谱GLM-4.5模型服务稳定性问题及解决方案

最新资讯

热门AI工具

热门资讯