上海AI实验室联合团队推出OWMM-Agent,家庭服务机器人技术获重大突破

近日,上海人工智能实验室联合新加坡国立大学、香港大学等机构的研究团队在家庭服务机器人领域取得重大突破,推出了名为”OWMM-Agent”的具身智能体。这项创新技术针对开放世界移动操作(OWMM)设计,首次实现了全局场景理解、机器人状态跟踪和多模态动作生成的统一建模。

在家庭服务机器人领域,如何让机器人理解开放环境中的自然语言指令、动态规划行动路径并精准执行操作,一直是学界和工业界的核心挑战。研究团队通过仿真器合成智能体轨迹数据,微调了针对该任务的多模态大模型OWMM-VLM。测试结果显示,该模型在真实环境下的零样本单步动作预测准确率达到90%。

这项技术的突破主要体现在三个方面:首先,OWMM-Agent能够处理开放语义下的移动抓取任务;其次,该架构实现了多模态智能体(VLM Agent)的创新设计;最后,通过数据合成和模型微调,显著提升了机器人在真实环境中的操作准确性。

研究团队已在arXiv平台公开发表相关论文,并开放了Github项目主页。这项技术的推出,标志着家庭服务机器人在开放环境操作能力方面迈出了重要一步,为未来智能家居服务提供了新的技术解决方案。

© 版权声明

相关文章