MIT华人团队突破具身智能研究:普通摄像头实现机器人高精度控制

近日,麻省理工学院(MIT)一项由三位华人博士主导的具身智能研究成果登上《Nature》主刊,引发学界广泛关注。该研究突破性地提出仅需普通摄像头即可实现机器人高精度控制的方法,彻底摆脱传统依赖人工建模和复杂传感器的技术路径。

研究团队核心成员李思哲、张安南和陈博远开发的新型深度学习框架,通过深度神经网络将机器人视频流实时映射至视觉运动雅可比场。这种创新方法仅需单个RGB相机捕捉画面,即可让机器人自主理解身体空间位置并执行预定轨迹控制。值得注意的是,刚于2025年6月获得博士学位的陈博远已入职OpenAI,这一动向被业界视为该科技公司布局硬件研发的重要信号。

实验验证阶段,团队选用三种特性迥异的机器人平台:丹麦Universal Robots的UR5机械臂成功完成从玻璃杯取物并推动苹果的精细操作;韩国Wonik Robotics的Allegro Hand实现精准握拳动作;法国波尔多大学开发的Poppy机械臂则展现出优异的适应性。这些设备在驱动方式、材料构成及制造成本方面差异显著,但均通过统一视觉框架实现控制。

该技术的突破性在于完全摒弃对机器人材料特性、驱动方式的先验假设,仅通过观察随机指令执行过程即可完成训练。研究团队特别指出,该方法尤其适用于传统难以建模的仿生机器人,这类设备常因材料柔软或复合特性导致感知能力受限。随着具身智能领域发展,这项成果有望大幅降低机器人自动化应用门槛,为医疗、制造等场景提供更灵活的解决方案。

目前,相关技术细节已通过同行评审在《Nature》正式发表,其开源特性将加速产业界应用落地。业界专家认为,这种”视觉即控制”的范式可能重塑下一代机器人系统的开发逻辑。

© 版权声明

相关文章