可灵AI发布全球首个统一多模态视频模型可灵O1，引领视频生成技术新纪元

AI产品动态6个月前发布 AI视野

2025年12月1日，可灵AI正式推出全球首个统一多模态视频模型——可灵O1，标志着视频生成技术进入全新阶段。该模型通过创新的技术架构，实现了文本、图像、视频等跨模态内容的无缝融合，为影视制作、广告创意及个人创作提供了高效的一站式解决方案。

可灵O1的核心突破在于其构建的全新生成式底座架构，引入MVL（多模态视觉语言）交互框架，彻底解决了传统视频生成工具功能割裂的问题。用户仅需通过单一输入框即可完成复杂指令的输入，大幅简化了操作流程。结合Chain-of-thought推理技术，模型具备强大的常识判断与事件推演能力，能够精准解析各类输入内容，确保生成结果符合逻辑与创作预期。

在技术细节上，可灵O1通过多视角主体构建技术，有效解决了视频生成中角色与场景一致性的行业难题。即使镜头角度剧烈变化，主体特征仍能保持高度稳定，同时支持多个独立主体的协同生成。测试数据显示，新模型在复杂场景渲染速度上较前代提升近40%，语义理解准确率达98.7%。

目前，可灵O1已在官方App及官网开放体验。其直观的对话式交互界面降低了技术门槛，用户无需专业背景即可完成从概念设计到成品输出的全流程创作。系统还支持3-10秒自由生成时长，赋予创作者更灵活的叙事控制权。

此次发布被视为AI视频生成领域的重要里程碑，有望重塑影视、广告、电商等内容生产生态。可灵AI表示，将持续优化模型性能，拓展更多垂直场景的应用可能性。

文章版权归作者所有，未经允许请勿转载。

可灵AI发布全球首个统一多模态视频模型可灵O1，引领视频生成技术新纪元

字节跳动豆包手机助手技术预览版发布：AI助手实现系统级整合，首发中兴nubia M153

生数科技Vidu Q2生图功能重磅升级：文生图与编辑模块上线，AI创作效率革命性提升

相关文章

京东首款自研AI毛绒玩具正式发布，搭载JoyAI大模型实现情绪感知

零一万物发布万智企业大模型平台2.0及AI Agent“万仔”，重塑企业工作流

理想汽车发布首款AI智能眼镜Livis，轻量化设计+MindGPT-4o交互，开启车外智能穿戴新生态

Meta与依视路联合发布Oakley Meta HSTN智能眼镜，专业运动市场迎来新突破

最新资讯

热门AI工具

热门资讯