多智能体具身自动驾驶:从V2X信息交换到共享世界模型
这篇综述论文探讨了自动驾驶从单一车辆智能向多智能体具身系统的转变,重点介绍了共享世界模型(SWMs)作为跨车辆的预测性表示。文章回顾了超过380篇出版物,涵盖V2X通信、协作感知、智能体间认知、协同规划、端到端协同驾驶以及闭环验证的仿真引擎。研究发现当前评估集中在仿真和离线协议,基于基础模型的协调缺乏实时安全保证,并提出了可验证的共享状态维护、鲁棒的意图与计划对齐以及安全协调行动等关键研究优先方向。
近年来,自动驾驶技术正经历一场深刻的范式转变:从依赖单一车辆智能的孤立系统,逐步演进为由多辆汽车、基础设施和行人等共同构成的多智能体具身系统。这些系统通过共享感知、推断意图并在不确定性下协调行动,有望大幅提升交通安全与效率。一篇发表于arXiv的综述论文《Multi-Agent Embodied Autonomous Driving: From V2X Information Exchange to Shared World Models》系统回顾了这一转型,并提出了“共享世界模型(Shared World Models, SWMs)”这一核心概念。
共享世界模型是一种跨智能体的预测性表示,能够在车辆、路侧设备及其他交通参与者之间维护一致的环境认知。论文作者团队(Senkang Hu等六人)梳理了超过380篇相关文献,覆盖车辆与万物通信(V2X)、协作感知、智能体间认知、协同规划、端到端协同驾驶以及用于闭环验证的仿真与数据引擎。研究核心问题在于:如何将交换的观测数据转化为对齐的状态表示、意图感知的交互行为以及协调的下游决策。
尽管该领域取得显著进展,但综述指出,当前多数研究仍局限于仿真环境、精心设计的基准测试和离线实验协议。基于基础模型(如大型语言模型)的协调方法尚未在开放交通场景下获得可验证的实时安全保证。这些空白凸显了多智能体具身自动驾驶(MAEAD)的三大研究优先方向:一是可验证的共享状态维护,即确保各智能体对环境认知的一致性;二是鲁棒的意图与计划对齐,使各方能准确预测并协调行动;三是在通信延迟和部署约束下实现安全的协调行动。
该论文于2026年6月11日提交至arXiv,主题涵盖机器人学(cs.RO)和计算机视觉(cs.CV)。随着自动驾驶进入多智能体时代,这项综述为后续研究提供了清晰的路线图,也为工程师和政策制定者指明了技术演进的关键挑战。