全球首个跨本体全域环视导航基座大模型NavFoM发布，开启机器人导航新纪元

AI产品动态2个月前发布 AI视野

银河通用联合北京大学、阿德莱德大学及浙江大学等科研机构，于2025年11月5日正式发布全球首个跨本体全域环视导航基座大模型 NavFoM（Navigation Foundation Model）。这一突破性技术首次实现了对视觉与语言导航、目标导向导航、视觉追踪及自动驾驶等多元任务的统一整合，标志着机器人导航技术从定制化开发迈入基础模型驱动的新阶段。

NavFoM的核心突破在于其全场景零样本适应能力。不同于传统导航模型需依赖预先建图或环境数据采集，该模型可直接在未经训练的室内外复杂场景中运行，包括人流密集的商场、动态变化的街道等。其创新性体现在两项关键技术：TVI Tokens（时空视角索引令牌）赋予模型动态理解环境变化的能力；BATS策略（预算感知令牌采样）则优化了低算力设备下的运行效率，确保毫秒级响应速度。

在硬件兼容性方面，NavFoM通过模块化设计支持异构本体适配，涵盖四足机器狗、轮式人形机器人、无人机及自动驾驶车辆等多种形态。开发者可基于同一框架开发不同设备的导航系统，显著降低技术门槛。例如在送餐场景中，搭载该模型的机器人不仅能自主避障，还能在目标丢失后重新规划路径，实现端到端的“看到-理解-行动”闭环。

技术底座方面，NavFoM依托跨任务数据集训练，包含800万条导航数据及400万条开放问答数据，规模达同类研究的两倍。这种海量数据训练使模型具备卓越的语言理解与空间语义解析能力，在多个国际基准测试中刷新了SOTA水平。目前，银河通用已向开发者开放基础框架，支持通过微调定制物流、救援等垂直领域应用模型。

业内专家指出，NavFoM的推出将加速具身智能在智慧零售、工业制造等领域的商业化落地。其“一次训练，全域部署”的特性有望解决机器人规模化应用的高边际成本问题，推动行业向标准化方向发展。随着模型生态的完善，未来或将成为智能设备移动能力的通用基座。

文章版权归作者所有，未经允许请勿转载。

全球首个跨本体全域环视导航基座大模型NavFoM发布，开启机器人导航新纪元

谷歌Gemini 3 Pro将于2025年11月推出：百万token上下文窗口重塑AI处理能力

AI助手能力边界解析：当AI遇到知识盲区时的应对策略

相关文章

腾讯元宝AI助手正式入驻微信视频号评论区，开启智能互动新体验

群核科技发布空间大模型SpatialGen：用AI生成可交互3D场景，推动空间智能革命

知乎启动“AI先行者计划”挖掘潜力选手，构建权威AI榜单

淘宝发布店小蜜5.0：AI客服实现多轮探需，转化率提升35%

最新资讯

热门AI工具

热门资讯