麻省理工学院计算机科学与人工智能实验室(CSAIL)与丰田研究院近日联合发布了一项名为“可引导场景生成”的突破性人工智能技术,该技术通过构建高度逼真的虚拟训练环境,显著提升了机器人在复杂场景中的学习与适应能力。这项研究成果于2025年10月11日正式公布,标志着机器人训练范式的重要革新。
该系统的核心创新在于其“可引导”特性,研究团队基于超过4400万个3D房间数据进行模型训练,并首次将蒙特卡洛树搜索(MCTS)算法应用于场景生成领域。MCTS通过序列决策过程动态优化场景参数,能够根据训练需求调整生成环境的真实性与复杂度。MIT博士生尼古拉斯·帕夫指出,这种渐进式场景构建方法生成的训练环境,其物理合理性和多样性远超传统扩散模型。
技术实现层面,该系统采用改进型扩散模型作为基础架构,结合“内部绘制”技术实现物体在数字空间的精准布局。通过模拟数万种物体排列组合,算法能自动筛选出符合物理规则的场景配置,有效解决了传统方法中常见的物体穿透、悬浮等失真问题。实验数据显示,在餐厅、厨房等典型生活场景中,该系统生成的训练环境可使机器人操作准确率提升40%以上。
亚马逊机器人应用科学家杰里米·比纳吉亚评价称,这项技术突破了机器人训练的两大瓶颈:既避免了真实数据采集的高成本,又克服了人工建模的效率限制。丰田研究院专家强调,这种“训练后优化+实时搜索”的混合模式,为机器人从实验室走向实际应用提供了关键支持。目前该技术已开始应用于家用服务机器人和工业机械臂的导航、抓取等核心能力训练。
© 版权声明
文章版权归作者所有,未经允许请勿转载。