全球首个跨本体全域环视导航基座大模型NavFoM发布,开启机器人导航新纪元

AI产品动态9小时前发布 AI视野

银河通用联合北京大学、阿德莱德大学及浙江大学等科研机构,于2025年11月5日正式发布全球首个跨本体全域环视导航基座大模型NavFoM(Navigation Foundation Model)。这一突破性技术首次实现了对视觉与语言导航、目标导向导航、视觉追踪及自动驾驶等多元任务的统一整合,标志着机器人导航技术从定制化开发迈入基础模型驱动的新阶段。

NavFoM的核心突破在于其全场景零样本适应能力。不同于传统导航模型需依赖预先建图或环境数据采集,该模型可直接在未经训练的室内外复杂场景中运行,包括人流密集的商场、动态变化的街道等。其创新性体现在两项关键技术:TVI Tokens(时空视角索引令牌)赋予模型动态理解环境变化的能力;BATS策略(预算感知令牌采样)则优化了低算力设备下的运行效率,确保毫秒级响应速度。

在硬件兼容性方面,NavFoM通过模块化设计支持异构本体适配,涵盖四足机器狗、轮式人形机器人、无人机及自动驾驶车辆等多种形态。开发者可基于同一框架开发不同设备的导航系统,显著降低技术门槛。例如在送餐场景中,搭载该模型的机器人不仅能自主避障,还能在目标丢失后重新规划路径,实现端到端的“看到-理解-行动”闭环。

技术底座方面,NavFoM依托跨任务数据集训练,包含800万条导航数据及400万条开放问答数据,规模达同类研究的两倍。这种海量数据训练使模型具备卓越的语言理解与空间语义解析能力,在多个国际基准测试中刷新了SOTA水平。目前,银河通用已向开发者开放基础框架,支持通过微调定制物流、救援等垂直领域应用模型。

业内专家指出,NavFoM的推出将加速具身智能在智慧零售、工业制造等领域的商业化落地。其“一次训练,全域部署”的特性有望解决机器人规模化应用的高边际成本问题,推动行业向标准化方向发展。随着模型生态的完善,未来或将成为智能设备移动能力的通用基座。

© 版权声明

相关文章