谷歌于2025年7月10日正式在Gemini应用中推出基于Veo 3模型的图像转视频功能,标志着AI视频生成技术进入新阶段。该功能允许用户将静态照片转换为8秒短视频,并支持添加背景音效、环境声及语音,实现音画同步输出。目前该功能已面向部分地区的AI Ultra和AI Pro订阅用户开放,首阶段通过网页端提供服务,移动端预计在本周内完成全球范围推送。
操作流程显示,用户需在Gemini提示栏选择”视频”工具,上传照片后通过文字描述设定动态效果,并可自由添加音频元素。生成的视频采用720p分辨率、16:9横屏MP4格式,适用于社交媒体传播。技术层面,Veo 3模型能实现绘画作品动态化、自然景观拟真运动等效果,例如使花朵绽放或云层流动。谷歌特别强调,所有输出视频均包含显性AI水印和隐形SynthID数字水印,以应对AI内容版权识别需求。
市场数据显示,自Veo 3模型七周前发布以来,用户已通过谷歌生态创建超4000万个视频内容。此次功能升级将每日生成限额设定为3条,且不累计额度。行业观察人士指出,该技术将显著降低视频创作门槛,对数字营销、艺术创作等领域产生深远影响,但同时也引发关于AI内容真实性的持续讨论。
© 版权声明
文章版权归作者所有,未经允许请勿转载。