2026-06-30 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 16:18 UTC+8

地理空间矢量数据质量自动评估：基于空间表示学习的GeoAI方法

本文提出Topo4Vec框架，通过拓扑错误模拟和空间表示学习自动评估地理空间矢量数据质量，在重叠建筑和道路网络错误检测中分别达到0.99和0.60的准确率。

来源arXiv Computer Vision作者: Hao Li, Chen Chu, Filip Biljecki, Cyrus Shahabi, Wenwen Li

地理空间矢量数据的质量是地理信息系统（GIS）领域的基础研究课题。然而，传统基于规则的评估算法在面对多样化的城市形态和海量数据时往往表现不佳。近年来，地理空间人工智能（GeoAI）在自动化地理空间分析方面展现出巨大潜力，但其在原生矢量数据上的应用仍处于起步阶段。为了填补这一研究空白，来自多个机构的研究人员提出了Topo4Vec——一种基于GeoAI的自动化框架，旨在通过先进的空间表示学习（SRL）实现可扩展的矢量数据质量评估。

Topo4Vec的核心创新在于通过拓扑错误模拟来减轻人工标注的负担。研究人员首先模拟了常见的拓扑错误，例如重叠多边形（如建筑物足迹）、道路网络中的超限和欠限错误（即连接错误），并利用这些模拟数据生成训练样本。随后，框架采用最先进的SRL方法将复杂的原生矢量几何（如折线和多边形）编码到潜在空间中，从而将拓扑错误与有效数据分离开来。这种编码方式使模型能够自动学习区分错误与正常数据的特征。

为了验证Topo4Vec的有效性，研究团队在三个具有不同城市形态的研究区域——洛杉矶、慕尼黑和新加坡——进行了系统评估。实验结果表明，该框架在检测重叠建筑物足迹时达到了0.99的最高准确率，而在检测道路网络超限和欠限错误时准确率为0.60。这些结果充分证明了Topo4Vec的鲁棒性和高效性。

从Topo4Vec中获得的经验为大规模地理空间数据的一致性和质量监控提供了新的方向。随着地理空间数据生态系统的快速扩展，这种可扩展且自主的GeoAI方法有望在数据质量控制中发挥关键作用。值得注意的是，论文中使用的代码和数据已在Figshare上公开，为后续研究和应用提供了便利。