2026-06-01 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

CoMo3R-SLAM：基於學習的三維重建先驗的協作式單目密集SLAM，用於户外多智能體系統

CoMo3R-SLAM是首個協作式單目密集RGB SLAM系統，利用學習的前饋三維重建先驗實現户外多智能體地圖構建。每個智能體運行先驗引導的前端進行實時跟蹤和局部密集融合，協調器執行密集點雲匹配、閉環Sim(3)同步和GPU加速的全局束調整。無需深度傳感器或參數化內參，僅憑單目RGB即可生成魯棒的跨智能體約束和全局一致的度量地圖。在Tanks and Temples和Waymo數據集上，CoMo3R-SLAM在四個場景中的三個取得最佳ATE，精度達到或超過最先進的RGB-D方法，同時在線運行速度達8 FPS。

來源arXiv Robotics作者: Zhihao Cao, Qi Shao, Shuhao Zhai, Feng Tian, Anh Nguyen, Hesheng Wang, Baoru Huang

協作式密集SLAM對於多機器人團隊在大規模户外環境中實現可擴展且一致的三維感知至關重要。現有系統通常依賴深度傳感器，導致有效載荷、功耗和標定成本顯著增加。單目RGB相機是一種輕量級替代方案，但協作式單目密集SLAM仍面臨尺度模糊、智能體間數據關聯不可靠等挑戰，尤其在户外場景中低重疊和重複結構使得傳統特徵匹配不可靠。為此，研究人員提出了CoMo3R-SLAM，這是首個利用學習的前饋三維重建先驗的協作式單目密集RGB SLAM系統，專為户外多智能體地圖構建設計。

CoMo3R-SLAM的系統架構分為兩部分：每個智能體運行一個先驗引導的前端，用於實時跟蹤和局部密集融合；協調器則執行密集點雲匹配以進行跨智能體驗證、閉環Sim(3)尺度同步，以及GPU加速的全局束調整和分段深度優化。該系統無需深度傳感器或參數化內參，僅憑單目RGB圖像即可生成魯棒的跨智能體約束和全局一致的度量地圖。

在Tanks and Temples和Waymo數據集上的評估顯示，CoMo3R-SLAM在Tanks and Temples的四個場景中三個取得了最佳絕對軌跡誤差（ATE），在Waymo數據集上的精度與最先進的RGB-D方法相當甚至更優，同時在線運行速度達到8 FPS。這一成果顯著降低了多機器人户外三維感知系統的硬件需求，為輕量級、低成本的協作式SLAM開闢了新路徑。該系統由Zhihao Cao等六位作者提出，論文於2026年5月28日提交至arXiv，編號2605.30488。未來的工作可能包括擴展到更多智能體、處理動態環境以及進一步優化實時性能。