以色列AI初创公司Decart于2025年7月18日正式发布全球首个实时无时长限制的扩散视频生成模型MirageLSD,标志着AI视频生成技术迈入实时交互时代。该模型由前特斯拉AI总监、OpenAI创始成员Andrej Karpathy参与投资,其核心技术Live-Stream Diffusion(LSD)实现了端到端延迟低于40毫秒、每秒24帧的无限长视频流实时生成,较传统模型响应速度提升16倍。
技术突破与应用场景
MirageLSD通过三大创新攻克行业难题:
1. 采用定制CUDA超大内核优化计算吞吐量,结合模型剪枝减少单帧计算负载;
2. 引入历史增强技术解决自回归模型的误差累积问题,确保长视频时间连贯性;
3. 硬件对齐架构设计使GPU效率最大化,支持生成过程中实时编辑与动态提示。
Karpathy在社交平台强调,该模型能深度理解视频内容语义,实现传统滤镜无法完成的智能交互——例如将直播画面实时转换为吉卜力动画风格,或通过文本指令让游戏角色手持光剑。潜在应用覆盖游戏开发(实时生成贴图)、影视制作(虚拟布景)、AR/VR(环境风格迁移)及电商(虚拟试衣),其演示案例显示用户可用简易道具完成专业级特效直播。
商业化进展
目前Mirage平台已开放网页端访问,移动端iOS/Android版本预计于2025年7月28日前上线。Decart透露将持续迭代面部一致性控制、语音交互等功能。行业观察者认为,该技术将重塑实时内容生产范式,其“零延迟+无限时长”特性尤其可能颠覆直播与即时通讯领域。
© 版权声明
文章版权归作者所有,未经允许请勿转载。