2026-07-03 12:00 UTC+8站内改写2 分钟阅读更新: 2026-07-03 16:18 UTC+8

MapDreamer：基于航空影像条件潜扩散的车道级地图生成

MapDreamer是一种生成式扩散模型，能从单张航空图像直接合成带有显式拓扑结构的车道级向量地图。它利用变分自编码器学习车道中心线和拓扑关系的紧凑潜表示，并通过基于Transformer的潜扩散模型预测图结构。为了对齐生成地图与观测场景，每个去噪步骤通过交叉注意力注入密集的航空特征。针对场景中车道数量的变化，提出了车道基数模块和背景幽灵潜变量，防止扩散过程中的插槽坍缩。此外，滑动窗口全局图聚合策略将局部瓦片拼接成城市级地图，同时通过编码的车道边界保持连通性。在源自Argoverse 2的UrbanLaneGraph上的实验表明，其几何和拓扑保真度优于非生成式基线。

来源arXiv Computer Vision作者: Julian Brandes, Philipp Crocoll, Wolfram Burgard

MapDreamer是一种创新的生成式扩散模型，专门用于从单张航空图像生成车道级向量地图，并明确包含拓扑结构。该模型由Julian Brandes等人提出，已被2026年欧洲计算机视觉会议（ECCV 2026）接收。在自动驾驶领域，高精地图的生成是关键技术之一，但传统方法在大规模应用中仍存在劳动密集、成本高昂等问题。MapDreamer旨在通过生成式方法简化这一过程，实现从航空影像到车道级地图的端到端合成。

该模型的核心架构包括三个主要部分。首先，使用变分自编码器学习车道中心线及其拓扑关系的紧凑潜表示。这一表示将复杂的车道结构压缩为低维潜在空间，便于后续生成。其次，一个基于Transformer的潜扩散模型负责预测图结构，通过逐步去噪从随机噪声中生成车道图。为了确保生成的地图与输入航空图像对齐，每个去噪步骤都通过交叉注意力机制注入密集的航空特征，从而使模型能够感知场景的具体布局。

针对不同场景中车道数量变化的问题，研究团队引入了两个关键组件。车道基数模块用于预测场景中车道的数量，而背景幽灵潜变量则作为一种学习缓冲区，在扩散过程中防止插槽坍缩，从而稳定地处理可变数量的车道。这一设计使得模型能够适应从简单道路到复杂交叉口的各种场景。

此外，为了解决大规模地图生成的问题，MapDreamer采用滑动窗口全局图聚合策略。该策略将局部瓦片无缝拼接成城市级地图，同时通过编码的车道边界保持连通性。这意味着模型可以在局部生成高质量的子图，然后通过聚合形成连贯的全局地图，为实际应用提供了可扩展性。

在实验部分，研究团队在来源于Argoverse 2数据集的UrbanLaneGraph上对MapDreamer进行了评估。结果表明，MapDreamer在几何和拓扑保真度方面均优于非生成式基线方法。具体而言，模型在车道中心线定位、拓扑连接准确性以及地图完整性等指标上均取得了显著提升。这项研究为自动驾驶中的高精地图生成提供了一种高效、可扩展的新途径，有望推动相关技术的实用化进程。