AI News HubLIVE
站内改写2 分钟阅读

SemCityLoc:基于语义3D城市模型的空中6自由度定位

SemCityLoc是一种新颖的空中定位方法,利用语义-几何对齐将无人机姿态估计转化为基于基础模型视觉先验和标准化LoD 3D城市模型的结构化表面配准。该方法无需依赖精确的GNSS信号或辐射度量丰富的3D重建,在重复和遮挡的城市环境中提高了位姿判别性。同时引入了首个包含厘米级精度UAV位姿与LoD1-LoD3语义城市模型的真实世界基准SemCityLockeD。实验表明,相比现有地图方法,召回率提升高达36%,平均位置误差从9.89米降至2.62米。代码和数据已公开。

来源arXiv Computer Vision作者: Jingfeng Mao, Xuyang Chen, Qilin Zhang, Oussema Dhaouadi, Guangming Wang, Brian Sheil, Daniel Cremers, Yan Xia, Olaf Wysocki

近日,一项由Jingfeng Mao等人完成的研究提出了SemCityLoc,这是一种基于语义3D城市模型的空中6自由度(6DoF)定位新方法。该研究已被ECCV 2026接收,并公开了相关代码和数据集,可在https://albertchen98.github.io/SemCityLoc获取。

传统的空中6DoF定位通常依赖于精确的GNSS信号或辐射度量丰富的3D重建,这限制了系统的可扩展性和机载部署能力。例如,在GPS信号弱的城市峡谷中,传统方法容易失效,而高密度3D重建又需要大量的存储和计算资源。SemCityLoc通过语义-几何对齐系统,将空中姿态估计重新定义为基于基础模型视觉先验与标准化LoD(Level of Detail)3D城市模型之间的结构化表面配准。与匹配稀疏轮廓或密集纹理不同,该方法将语义表面和单目深度与轻量级的语义3D建筑模型进行对齐,从而在重复和遮挡的城市环境中提高了位姿判别能力。

为了对这种方法进行准确评估,研究团队引入了SemCityLockeD,这是首个结合厘米级精度无人机位姿、标准化LoD1-LoD3语义城市模型以及具有挑战性的低空影像的真实世界基准。该基准涵盖了不同LoD级别的城市模型,从LoD1的简单块状模型到LoD3的详细屋顶和立面模型,为算法提供了丰富的语义信息。在实验中,SemCityLoc与现有的多种基于地图的方法进行了比较。结果表明,SemCityLoc在召回率上提升了高达36%,并在城市峡谷等困难场景中将平均位置误差从9.89米降低至2.62米。研究团队指出,语义结构化几何提供了足够且可扩展的约束条件,无需辐射度量场景重建即可实现高精度空中定位。

这一方法的意义在于,它展示了如何利用广泛可用的语义3D城市模型(如LoD模型)来实现精确的空中定位,而无需昂贵的传感器或密集的三维重建。这对于无人机导航、自主驾驶和城市空中交通管理等应用具有重要价值。此外,SemCityLockeD基准的建立也为该领域提供了一个标准化的评估平台,有助于推动相关研究的进展。代码和数据的公开也便于其他研究者复现和扩展这项工作。