商汤科技发布“悟能”具身智能平台,推动AI技术规模化落地

7月27日,在2025世界人工智能大会(WAIC)大模型论坛上,商汤科技正式发布“悟能”具身智能平台。该平台以自主研发的具身世界模型为核心引擎,依托商汤大装置的端云协同算力体系,为机器人及智能设备提供多模态感知、高精度视觉导航与自然交互能力,标志着具身智能技术向规模化落地迈出关键一步。

平台技术架构呈现三层设计:感知层整合视觉、语音与触觉多源传感器输入;决策层通过大语言模型与世界模型的协同实现动态规划;行动层采用视觉-语言-动作(VLA)端到端控制机制,可适配机械臂、移动底盘等执行单元。现场演示中,搭载该平台的人形机器人流畅完成《长安的荔枝》PPT讲解任务,具备自动翻页、实时问答与章节总结功能,其自然语言交互效果接近人类表达水平。

商汤科技董事长徐立指出,平台已实现三项突破:一是通过世界模型生成7视角同步视频,解决自动驾驶数据稀缺难题;二是构建人-物-场4D场景理解能力,可响应“厨房架面搜寻物品”等复杂指令;三是实现虚拟与现实空间交互,为游戏化仿真训练提供支持。目前平台已与物流搬运、家庭服务等领域的硬件厂商达成预装合作,通过数据回流反哺模型迭代,形成技术闭环。

行业分析认为,“悟能”平台的发布将加速具身智能在工业、服务等场景的渗透。其端侧芯片适配特性有助于降低部署门槛,而商汤在自动驾驶领域积累的千万级仿真数据,为平台持续进化提供独特优势。随着WAIC期间多项合作签约,该技术有望年内实现商业化落地。

© 版权声明

相关文章