2026-06-30 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 16:18 UTC+8

地理空間矢量數據質量自動評估：基於空間表示學習的GeoAI方法

本文提出Topo4Vec框架，通過拓撲錯誤模擬和空間表示學習自動評估地理空間矢量數據質量，在重疊建築和道路網絡錯誤檢測中分別達到0.99和0.60的準確率。

來源arXiv Computer Vision作者: Hao Li, Chen Chu, Filip Biljecki, Cyrus Shahabi, Wenwen Li

地理空間矢量數據的質量是地理信息系統（GIS）領域的基礎研究課題。然而，傳統基於規則的評估算法在面對多樣化的城市形態和海量數據時往往表現不佳。近年來，地理空間人工智能（GeoAI）在自動化地理空間分析方面展現出巨大潛力，但其在原生矢量數據上的應用仍處於起步階段。為了填補這一研究空白，來自多個機構的研究人員提出了Topo4Vec——一種基於GeoAI的自動化框架，旨在通過先進的空間表示學習（SRL）實現可擴展的矢量數據質量評估。

Topo4Vec的核心創新在於通過拓撲錯誤模擬來減輕人工標註的負擔。研究人員首先模擬了常見的拓撲錯誤，例如重疊多邊形（如建築物足跡）、道路網絡中的超限和欠限錯誤（即連接錯誤），並利用這些模擬數據生成訓練樣本。隨後，框架採用最先進的SRL方法將複雜的原生矢量幾何（如折線和多邊形）編碼到潛在空間中，從而將拓撲錯誤與有效數據分離開來。這種編碼方式使模型能夠自動學習區分錯誤與正常數據的特徵。

為了驗證Topo4Vec的有效性，研究團隊在三個具有不同城市形態的研究區域——洛杉磯、慕尼黑和新加坡——進行了系統評估。實驗結果表明，該框架在檢測重疊建築物足跡時達到了0.99的最高準確率，而在檢測道路網絡超限和欠限錯誤時準確率為0.60。這些結果充分證明了Topo4Vec的魯棒性和高效性。

從Topo4Vec中獲得的經驗為大規模地理空間數據的一致性和質量監控提供了新的方向。隨着地理空間數據生態系統的快速擴展，這種可擴展且自主的GeoAI方法有望在數據質量控制中發揮關鍵作用。值得注意的是，論文中使用的代碼和數據已在Figshare上公開，為後續研究和應用提供了便利。