2026-06-30 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 16:15 UTC+8

GeoISF：基于实例语义森林的大规模跨视图地理定位——地面激光雷达到卫星图像

GeoISF是一种新颖的大规模LiDAR到图像地理定位管道，通过构建基于WordNet的实例语义森林，增强时间语义表示和区分能力，有效弥合点云与卫星图像之间的模态差距，在KITTI数据集上R@10指标比并行方法提升13.22倍。

来源arXiv Computer Vision作者: Di Hu, Xia Yuan, Chunxia Zhao

近日，一项名为GeoISF的研究提出了一种创新的解决方案，用于大规模跨视图地理定位，即从地面激光雷达（LiDAR）点云数据定位到卫星图像。该研究由Di Hu等人开发，旨在解决现有LiDAR到图像跨视图定位方法在大规模场景下因语义对齐有限和模态差异而面临的挑战。

GeoISF的核心创新是引入了一种基于WordNet构建的实例语义森林。WordNet是一个大型词汇数据库，通过将语义树从多个帧整合，该森林增强了时间语义表示和判别能力。这种环境语义表示作为共享媒介，有效弥合了点云与卫星图像之间的模态鸿沟，从而提高了语义匹配的准确性。与现有方法相比，GeoISF不仅考虑了单帧的语义信息，还利用了时间维度上的语义一致性，使得定位更加鲁棒。

研究团队在KITTI数据集上进行了大量实验，KITTI是一个包含市区、乡村和高速公路等场景的自动驾驶基准数据集。结果显示，GeoISF在R@10指标上比现有的并行LiDAR到图像方法提升了13.22倍，显著优于传统方法。这一成果填补了大规模LiDAR到图像跨视图定位领域的空白，为计算精度和效率问题提供了稳健的解决方案。具体来说，R@10表示检索结果中前10个候选位置包含正确位置的概率，GeoISF的高分表明其在实际应用中具有极高的可靠性。

该研究不仅展示了强大的性能，还承诺将代码作为开源资源发布，以促进更广泛的研究社区发展。GeoISF的出现为自动驾驶、机器人导航等领域中的地理定位技术开辟了新途径。未来，该方法有望被进一步扩展到其他传感器组合，如雷达到图像，或应用于更具挑战性的无GPS环境。总而言之，GeoISF通过创新的语义表示方法，为跨视图地理定位设定了一个新的性能基准。