AI News HubLIVE
站內改寫2 分鐘閱讀

MapDreamer:基於航空影像條件潛擴散的車道級地圖生成

MapDreamer是一種生成式擴散模型,能從單張航空圖像直接合成帶有顯式拓撲結構的車道級向量地圖。它利用變分自編碼器學習車道中心線和拓撲關係的緊湊潛表示,並通過基於Transformer的潛擴散模型預測圖結構。為了對齊生成地圖與觀測場景,每個去噪步驟通過交叉注意力注入密集的航空特徵。針對場景中車道數量的變化,提出了車道基數模塊和背景幽靈潛變量,防止擴散過程中的插槽坍縮。此外,滑動窗口全局圖聚合策略將局部瓦片拼接成城市級地圖,同時通過編碼的車道邊界保持連通性。在源自Argoverse 2的UrbanLaneGraph上的實驗表明,其幾何和拓撲保真度優於非生成式基線。

來源arXiv Computer Vision作者: Julian Brandes, Philipp Crocoll, Wolfram Burgard

MapDreamer是一種創新的生成式擴散模型,專門用於從單張航空圖像生成車道級向量地圖,並明確包含拓撲結構。該模型由Julian Brandes等人提出,已被2026年歐洲計算機視覺會議(ECCV 2026)接收。在自動駕駛領域,高精地圖的生成是關鍵技術之一,但傳統方法在大規模應用中仍存在勞動密集、成本高昂等問題。MapDreamer旨在通過生成式方法簡化這一過程,實現從航空影像到車道級地圖的端到端合成。

該模型的核心架構包括三個主要部分。首先,使用變分自編碼器學習車道中心線及其拓撲關係的緊湊潛表示。這一表示將複雜的車道結構壓縮為低維潛在空間,便於後續生成。其次,一個基於Transformer的潛擴散模型負責預測圖結構,通過逐步去噪從隨機噪聲中生成車道圖。為了確保生成的地圖與輸入航空圖像對齊,每個去噪步驟都通過交叉注意力機制注入密集的航空特徵,從而使模型能夠感知場景的具體佈局。

針對不同場景中車道數量變化的問題,研究團隊引入了兩個關鍵組件。車道基數模塊用於預測場景中車道的數量,而背景幽靈潛變量則作為一種學習緩衝區,在擴散過程中防止插槽坍縮,從而穩定地處理可變數量的車道。這一設計使得模型能夠適應從簡單道路到複雜交叉口的各種場景。

此外,為了解決大規模地圖生成的問題,MapDreamer採用滑動窗口全局圖聚合策略。該策略將局部瓦片無縫拼接成城市級地圖,同時通過編碼的車道邊界保持連通性。這意味着模型可以在局部生成高質量的子圖,然後通過聚合形成連貫的全局地圖,為實際應用提供了可擴展性。

在實驗部分,研究團隊在來源於Argoverse 2數據集的UrbanLaneGraph上對MapDreamer進行了評估。結果表明,MapDreamer在幾何和拓撲保真度方面均優於非生成式基線方法。具體而言,模型在車道中心線定位、拓撲連接準確性以及地圖完整性等指標上均取得了顯著提升。這項研究為自動駕駛中的高精地圖生成提供了一種高效、可擴展的新途徑,有望推動相關技術的實用化進程。