近日,AI初创公司Higgsfield推出的Draw-to-Video功能引发行业广泛关注。该功能通过图形化交互方式,用户仅需在静态图片上绘制箭头、标记动作区域并输入简单指令,即可生成具有电影级动态效果的视频,彻底革新了传统文本提示的生成模式。
技术实现上,该功能基于Higgsfield自主研发的DoP I2V-01-preview模型,结合了专业级镜头控制与世界建模能力。用户上传图片后,通过绘制元素(如箭头指示人物入场方向、爆炸标记特效区域)配合自然语言指令(如”镜头推进”或”角色向左移动”),系统能在数分钟内完成传统影视制作中需复杂设备与高成本实现的动态效果。实测显示,透明PNG格式的素材配合分步骤标记(Step 1/2/3)能显著提升生成精度。
行业专家指出,该技术突破了AI视频生成的两大瓶颈:一是通过空间标记替代文本提示,降低创作门槛;二是采用多模态控制方案,有效缓解了角色一致性难题。目前该功能已集成70余种专业运镜模板,包括希区柯克式变焦、360度环绕等电影级效果,被广告、短视频创作者及独立制片人应用于分镜预演、特效模拟等场景。
Higgsfield CEO Alex Mashrabov透露,公司正在构建更完善的世界模型体系,未来将实现跨镜头角色与场景的智能连贯。该功能现已在官网开放体验,移动端应用同步支持基础运镜特效生成。
© 版权声明
文章版权归作者所有,未经允许请勿转载。