可灵AI发布全球首个统一多模态视频模型可灵O1,引领视频生成技术新纪元

2025年12月1日,可灵AI正式推出全球首个统一多模态视频模型——可灵O1,标志着视频生成技术进入全新阶段。该模型通过创新的技术架构,实现了文本、图像、视频等跨模态内容的无缝融合,为影视制作广告创意及个人创作提供了高效的一站式解决方案。

可灵O1的核心突破在于其构建的全新生成式底座架构,引入MVL(多模态视觉语言)交互框架,彻底解决了传统视频生成工具功能割裂的问题。用户仅需通过单一输入框即可完成复杂指令的输入,大幅简化了操作流程。结合Chain-of-thought推理技术,模型具备强大的常识判断与事件推演能力,能够精准解析各类输入内容,确保生成结果符合逻辑与创作预期。

在技术细节上,可灵O1通过多视角主体构建技术,有效解决了视频生成中角色与场景一致性的行业难题。即使镜头角度剧烈变化,主体特征仍能保持高度稳定,同时支持多个独立主体的协同生成。测试数据显示,新模型在复杂场景渲染速度上较前代提升近40%,语义理解准确率达98.7%。

目前,可灵O1已在官方App及官网开放体验。其直观的对话式交互界面降低了技术门槛,用户无需专业背景即可完成从概念设计到成品输出的全流程创作。系统还支持3-10秒自由生成时长,赋予创作者更灵活的叙事控制权。

此次发布被视为AI视频生成领域的重要里程碑,有望重塑影视、广告、电商等内容生产生态。可灵AI表示,将持续优化模型性能,拓展更多垂直场景的应用可能性。

© 版权声明

相关文章