2025年12月28日,人工智能领域国际会议AAAI 2026公布论文录用结果,小鹏汽车与北京大学计算机学院多媒体信息处理全国重点实验室联合完成的论文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入选。该研究提出了一种专为端到端自动驾驶VLA(视觉语言代理)模型定制的高效视觉Token剪枝框架FastDriveVLA,标志着自动驾驶技术领域的重要突破。
FastDriveVLA的核心创新在于其即插即用的视觉Token剪枝器ReconPruner。该组件可直接嵌入自动驾驶VLA模型进行视觉Token剪枝,无需重新训练整个模型,显著提升了模型推理效率。为支持剪枝器训练,研究团队构建了包含24.1万个图像-掩码对的nuScenes-FG数据集,覆盖6个摄像头视角,为自动驾驶前景分割研究提供了大规模标注数据资源。
测试数据显示,该框架在nuScenes数据集上取得当前最优性能:当剪枝比例为25%时,驾驶性能基本无衰减,L2轨迹误差与碰撞率指标甚至优于未剪枝基准模型;剪枝比例达50%时,各项指标呈现更优平衡性,同时模型推理效率获得显著提升。这一成果为自动驾驶VLA模型建立了高效视觉Token剪枝的新范式,同时树立了车端大模型高效部署的技术标杆。
小鹏汽车董事长何小鹏通过社交媒体表示:”很高兴在探索L4自动驾驶的道路上取得新突破。我们将持续深耕物理AI领域,推动第二代VLA技术为用户带来更卓越的智驾体验。”据悉,小鹏汽车未来将以L4级自动驾驶为目标,加大AI大模型研发投入,加速物理AI大模型在智能汽车场景的落地应用。
此次产学研合作成果不仅展现了自动驾驶技术的前沿进展,也为行业提供了可复用的高效模型部署方案,对推动智能驾驶技术商业化进程具有重要实践意义。
© 版权声明
文章版权归作者所有,未经允许请勿转载。