2026-07-03 12:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-07-03 16:18 UTC+8

MapDreamer：基於航空影像條件潛擴散的車道級地圖生成

MapDreamer是一種生成式擴散模型，能從單張航空圖像直接合成帶有顯式拓撲結構的車道級向量地圖。它利用變分自編碼器學習車道中心線和拓撲關係的緊湊潛表示，並通過基於Transformer的潛擴散模型預測圖結構。為了對齊生成地圖與觀測場景，每個去噪步驟通過交叉注意力注入密集的航空特徵。針對場景中車道數量的變化，提出了車道基數模塊和背景幽靈潛變量，防止擴散過程中的插槽坍縮。此外，滑動窗口全局圖聚合策略將局部瓦片拼接成城市級地圖，同時通過編碼的車道邊界保持連通性。在源自Argoverse 2的UrbanLaneGraph上的實驗表明，其幾何和拓撲保真度優於非生成式基線。

來源arXiv Computer Vision作者: Julian Brandes, Philipp Crocoll, Wolfram Burgard

MapDreamer是一種創新的生成式擴散模型，專門用於從單張航空圖像生成車道級向量地圖，並明確包含拓撲結構。該模型由Julian Brandes等人提出，已被2026年歐洲計算機視覺會議（ECCV 2026）接收。在自動駕駛領域，高精地圖的生成是關鍵技術之一，但傳統方法在大規模應用中仍存在勞動密集、成本高昂等問題。MapDreamer旨在通過生成式方法簡化這一過程，實現從航空影像到車道級地圖的端到端合成。

該模型的核心架構包括三個主要部分。首先，使用變分自編碼器學習車道中心線及其拓撲關係的緊湊潛表示。這一表示將複雜的車道結構壓縮為低維潛在空間，便於後續生成。其次，一個基於Transformer的潛擴散模型負責預測圖結構，通過逐步去噪從隨機噪聲中生成車道圖。為了確保生成的地圖與輸入航空圖像對齊，每個去噪步驟都通過交叉注意力機制注入密集的航空特徵，從而使模型能夠感知場景的具體佈局。

針對不同場景中車道數量變化的問題，研究團隊引入了兩個關鍵組件。車道基數模塊用於預測場景中車道的數量，而背景幽靈潛變量則作為一種學習緩衝區，在擴散過程中防止插槽坍縮，從而穩定地處理可變數量的車道。這一設計使得模型能夠適應從簡單道路到複雜交叉口的各種場景。

此外，為了解決大規模地圖生成的問題，MapDreamer採用滑動窗口全局圖聚合策略。該策略將局部瓦片無縫拼接成城市級地圖，同時通過編碼的車道邊界保持連通性。這意味着模型可以在局部生成高質量的子圖，然後通過聚合形成連貫的全局地圖，為實際應用提供了可擴展性。

在實驗部分，研究團隊在來源於Argoverse 2數據集的UrbanLaneGraph上對MapDreamer進行了評估。結果表明，MapDreamer在幾何和拓撲保真度方面均優於非生成式基線方法。具體而言，模型在車道中心線定位、拓撲連接準確性以及地圖完整性等指標上均取得了顯著提升。這項研究為自動駕駛中的高精地圖生成提供了一種高效、可擴展的新途徑，有望推動相關技術的實用化進程。