地理空間向量資料質量自動評估:基於空間表示學習的GeoAI方法
本文提出Topo4Vec框架,透過拓撲錯誤模擬和空間表示學習自動評估地理空間向量資料質量,在重疊建築和道路網路錯誤檢測中分別達到0.99和0.60的準確率。
地理空間向量資料的質量是地理資訊系統(GIS)領域的基礎研究課題。然而,傳統基於規則的評估演算法在面對多樣化的城市形態和海量資料時往往表現不佳。近年來,地理空間人工智慧(GeoAI)在自動化地理空間分析方面展現出巨大潛力,但其在原生向量資料上的應用仍處於起步階段。為了填補這一研究空白,來自多個機構的研究人員提出了Topo4Vec——一種基於GeoAI的自動化框架,旨在透過先進的空間表示學習(SRL)實現可擴充套件的向量資料質量評估。
Topo4Vec的核心創新在於透過拓撲錯誤模擬來減輕人工標註的負擔。研究人員首先模擬了常見的拓撲錯誤,例如重疊多邊形(如建築物足跡)、道路網路中的超限和欠限錯誤(即連線錯誤),並利用這些模擬資料生成訓練樣本。隨後,框架採用最先進的SRL方法將複雜的原生向量幾何(如折線和多邊形)編碼到潛在空間中,從而將拓撲錯誤與有效資料分離開來。這種編碼方式使模型能夠自動學習區分錯誤與正常資料的特徵。
為了驗證Topo4Vec的有效性,研究團隊在三個具有不同城市形態的研究區域——洛杉磯、慕尼黑和新加坡——進行了系統評估。實驗結果表明,該框架在檢測重疊建築物足跡時達到了0.99的最高準確率,而在檢測道路網路超限和欠限錯誤時準確率為0.60。這些結果充分證明了Topo4Vec的魯棒性和高效性。
從Topo4Vec中獲得的經驗為大規模地理空間資料的一致性和質量監控提供了新的方向。隨著地理空間資料生態系統的快速擴充套件,這種可擴充套件且自主的GeoAI方法有望在資料質量控制中發揮關鍵作用。值得注意的是,論文中使用的程式碼和資料已在Figshare上公開,為後續研究和應用提供了便利。