AI News HubLIVE
站内改写2 分钟阅读

MapDreamer:基于航空影像条件潜扩散的车道级地图生成

MapDreamer是一种生成式扩散模型,能从单张航空图像直接合成带有显式拓扑结构的车道级向量地图。它利用变分自编码器学习车道中心线和拓扑关系的紧凑潜表示,并通过基于Transformer的潜扩散模型预测图结构。为了对齐生成地图与观测场景,每个去噪步骤通过交叉注意力注入密集的航空特征。针对场景中车道数量的变化,提出了车道基数模块和背景幽灵潜变量,防止扩散过程中的插槽坍缩。此外,滑动窗口全局图聚合策略将局部瓦片拼接成城市级地图,同时通过编码的车道边界保持连通性。在源自Argoverse 2的UrbanLaneGraph上的实验表明,其几何和拓扑保真度优于非生成式基线。

来源arXiv Computer Vision作者: Julian Brandes, Philipp Crocoll, Wolfram Burgard

MapDreamer是一种创新的生成式扩散模型,专门用于从单张航空图像生成车道级向量地图,并明确包含拓扑结构。该模型由Julian Brandes等人提出,已被2026年欧洲计算机视觉会议(ECCV 2026)接收。在自动驾驶领域,高精地图的生成是关键技术之一,但传统方法在大规模应用中仍存在劳动密集、成本高昂等问题。MapDreamer旨在通过生成式方法简化这一过程,实现从航空影像到车道级地图的端到端合成。

该模型的核心架构包括三个主要部分。首先,使用变分自编码器学习车道中心线及其拓扑关系的紧凑潜表示。这一表示将复杂的车道结构压缩为低维潜在空间,便于后续生成。其次,一个基于Transformer的潜扩散模型负责预测图结构,通过逐步去噪从随机噪声中生成车道图。为了确保生成的地图与输入航空图像对齐,每个去噪步骤都通过交叉注意力机制注入密集的航空特征,从而使模型能够感知场景的具体布局。

针对不同场景中车道数量变化的问题,研究团队引入了两个关键组件。车道基数模块用于预测场景中车道的数量,而背景幽灵潜变量则作为一种学习缓冲区,在扩散过程中防止插槽坍缩,从而稳定地处理可变数量的车道。这一设计使得模型能够适应从简单道路到复杂交叉口的各种场景。

此外,为了解决大规模地图生成的问题,MapDreamer采用滑动窗口全局图聚合策略。该策略将局部瓦片无缝拼接成城市级地图,同时通过编码的车道边界保持连通性。这意味着模型可以在局部生成高质量的子图,然后通过聚合形成连贯的全局地图,为实际应用提供了可扩展性。

在实验部分,研究团队在来源于Argoverse 2数据集的UrbanLaneGraph上对MapDreamer进行了评估。结果表明,MapDreamer在几何和拓扑保真度方面均优于非生成式基线方法。具体而言,模型在车道中心线定位、拓扑连接准确性以及地图完整性等指标上均取得了显著提升。这项研究为自动驾驶中的高精地图生成提供了一种高效、可扩展的新途径,有望推动相关技术的实用化进程。