2026-06-29 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-29 16:09 UTC+8

SemCityLoc：基于语义3D城市模型的空中6自由度定位

SemCityLoc是一种新颖的空中定位方法，利用语义-几何对齐将无人机姿态估计转化为基于基础模型视觉先验和标准化LoD 3D城市模型的结构化表面配准。该方法无需依赖精确的GNSS信号或辐射度量丰富的3D重建，在重复和遮挡的城市环境中提高了位姿判别性。同时引入了首个包含厘米级精度UAV位姿与LoD1-LoD3语义城市模型的真实世界基准SemCityLockeD。实验表明，相比现有地图方法，召回率提升高达36%，平均位置误差从9.89米降至2.62米。代码和数据已公开。

来源arXiv Computer Vision作者: Jingfeng Mao, Xuyang Chen, Qilin Zhang, Oussema Dhaouadi, Guangming Wang, Brian Sheil, Daniel Cremers, Yan Xia, Olaf Wysocki

近日，一项由Jingfeng Mao等人完成的研究提出了SemCityLoc，这是一种基于语义3D城市模型的空中6自由度（6DoF）定位新方法。该研究已被ECCV 2026接收，并公开了相关代码和数据集，可在https://albertchen98.github.io/SemCityLoc获取。

传统的空中6DoF定位通常依赖于精确的GNSS信号或辐射度量丰富的3D重建，这限制了系统的可扩展性和机载部署能力。例如，在GPS信号弱的城市峡谷中，传统方法容易失效，而高密度3D重建又需要大量的存储和计算资源。SemCityLoc通过语义-几何对齐系统，将空中姿态估计重新定义为基于基础模型视觉先验与标准化LoD（Level of Detail）3D城市模型之间的结构化表面配准。与匹配稀疏轮廓或密集纹理不同，该方法将语义表面和单目深度与轻量级的语义3D建筑模型进行对齐，从而在重复和遮挡的城市环境中提高了位姿判别能力。

为了对这种方法进行准确评估，研究团队引入了SemCityLockeD，这是首个结合厘米级精度无人机位姿、标准化LoD1-LoD3语义城市模型以及具有挑战性的低空影像的真实世界基准。该基准涵盖了不同LoD级别的城市模型，从LoD1的简单块状模型到LoD3的详细屋顶和立面模型，为算法提供了丰富的语义信息。在实验中，SemCityLoc与现有的多种基于地图的方法进行了比较。结果表明，SemCityLoc在召回率上提升了高达36%，并在城市峡谷等困难场景中将平均位置误差从9.89米降低至2.62米。研究团队指出，语义结构化几何提供了足够且可扩展的约束条件，无需辐射度量场景重建即可实现高精度空中定位。

这一方法的意义在于，它展示了如何利用广泛可用的语义3D城市模型（如LoD模型）来实现精确的空中定位，而无需昂贵的传感器或密集的三维重建。这对于无人机导航、自主驾驶和城市空中交通管理等应用具有重要价值。此外，SemCityLockeD基准的建立也为该领域提供了一个标准化的评估平台，有助于推动相关研究的进展。代码和数据的公开也便于其他研究者复现和扩展这项工作。