2026-06-01 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

CoMo3R-SLAM：基于学习的三维重建先验的协作式单目密集SLAM，用于户外多智能体系统

CoMo3R-SLAM是首个协作式单目密集RGB SLAM系统，利用学习的前馈三维重建先验实现户外多智能体地图构建。每个智能体运行先验引导的前端进行实时跟踪和局部密集融合，协调器执行密集点云匹配、闭环Sim(3)同步和GPU加速的全局束调整。无需深度传感器或参数化内参，仅凭单目RGB即可生成鲁棒的跨智能体约束和全局一致的度量地图。在Tanks and Temples和Waymo数据集上，CoMo3R-SLAM在四个场景中的三个取得最佳ATE，精度达到或超过最先进的RGB-D方法，同时在线运行速度达8 FPS。

来源arXiv Robotics作者: Zhihao Cao, Qi Shao, Shuhao Zhai, Feng Tian, Anh Nguyen, Hesheng Wang, Baoru Huang

协作式密集SLAM对于多机器人团队在大规模户外环境中实现可扩展且一致的三维感知至关重要。现有系统通常依赖深度传感器，导致有效载荷、功耗和标定成本显著增加。单目RGB相机是一种轻量级替代方案，但协作式单目密集SLAM仍面临尺度模糊、智能体间数据关联不可靠等挑战，尤其在户外场景中低重叠和重复结构使得传统特征匹配不可靠。为此，研究人员提出了CoMo3R-SLAM，这是首个利用学习的前馈三维重建先验的协作式单目密集RGB SLAM系统，专为户外多智能体地图构建设计。

CoMo3R-SLAM的系统架构分为两部分：每个智能体运行一个先验引导的前端，用于实时跟踪和局部密集融合；协调器则执行密集点云匹配以进行跨智能体验证、闭环Sim(3)尺度同步，以及GPU加速的全局束调整和分段深度优化。该系统无需深度传感器或参数化内参，仅凭单目RGB图像即可生成鲁棒的跨智能体约束和全局一致的度量地图。

在Tanks and Temples和Waymo数据集上的评估显示，CoMo3R-SLAM在Tanks and Temples的四个场景中三个取得了最佳绝对轨迹误差（ATE），在Waymo数据集上的精度与最先进的RGB-D方法相当甚至更优，同时在线运行速度达到8 FPS。这一成果显著降低了多机器人户外三维感知系统的硬件需求，为轻量级、低成本的协作式SLAM开辟了新路径。该系统由Zhihao Cao等六位作者提出，论文于2026年5月28日提交至arXiv，编号2605.30488。未来的工作可能包括扩展到更多智能体、处理动态环境以及进一步优化实时性能。