Physical Intelligence发布π*0.6机器人模型,Recap训练法突破复杂任务执行瓶颈

美国具身智能初创公司Physical Intelligence(PI)于本周正式发布新一代机器人基础模型π*0.6,该模型通过创新的Recap训练法显著提升机器人在复杂任务中的成功率和执行效率。目前搭载该系统的机械臂已在公司内部实现90%成功率的咖啡制作服务,标志着视觉-语言-动作(VLA)模型在开放环境应用取得突破性进展。

技术架构革新突破模仿学习瓶颈
传统机器人依赖人类示范数据的模仿学习方式存在明显局限,当环境变化时易出现错误累积问题。π*0.6引入三阶段Recap训练机制:首先通过标准示范建立基础动作模式,随后由远程操作员实时纠正执行偏差,最终借助自主实践环节的价值函数预测完成信用分配。这种架构使模型能从错误数据中提取有效信号,而非简单重复预设动作。实验数据显示,该方法成功打破错误连锁反应,在组装纸箱等长程任务中实现关键动作的精准优化。

商业化落地验证泛化能力
PI联合创始人Sergey Levine教授透露,经微调的π*0.6模型已适配公司办公场景的咖啡制作需求,可稳定完成拿铁、美式等饮品制备。相较于2024年发布的π0模型仅能处理结构化家务任务,新版本在动态环境中的适应能力显著提升。这得益于其30亿参数视觉语言基座模型与条件流匹配技术的结合,使单系统可控制多类物理平台执行异构任务。

资本与技术双重驱动
这家成立于2023年的旧金山公司,在去年完成4亿美元融资后估值突破20亿美元。其技术路线持续聚焦VLA模型开发,先后推出π0、π0.5等迭代版本。最新开源的π0.5模型已展示出在陌生厨房环境执行清洁任务的泛化能力,而π*0.6进一步将真机训练数据利用率提升300%,大幅降低场景适配成本。行业分析指出,该进展或将加速服务机器人替代基础人力劳动的进程,特别是在零售、餐饮等高频标准化服务领域。

© 版权声明

相关文章