AI News HubLIVE
站内改写2 分で読了

CoMo3R-SLAM:学習された3D再構成事前分布を用いた協調単眼密SLAMと屋外マルチエージェントシステム

CoMo3R-SLAMは、ロバストな学習済みフィードフォワード3D再構成事前分布を活用する初の協調単眼密RGB SLAMシステムで、屋外マルチエージェントのマッピングを実現する。各エージェントは事前分布誘導のフロントエンドでリアルタイム追跡と局所密融合を行い、コーディネータは密ポイントマップマッチング、閉形式Sim(3)ゲージ同期、GPU高速化グローバルバンドル調整を実行する。深度センサやパラメトリック内部パラメータを必要とせず、単眼RGBのみでロバストなエージェント間制約とグローバル一貫性のあるメトリックマップを生成する。Tanks and TemplesおよびWaymoデータセットにおいて、4シーンのうち3シーンで最良のATEを達成し、Waymoでも競争力のある精度を示し、最先端のRGB-D手法に匹敵または凌駕しつつ、オンラインで8 FPSで動作する。

ソースarXiv Robotics著者: Zhihao Cao, Qi Shao, Shuhao Zhai, Feng Tian, Anh Nguyen, Hesheng Wang, Baoru Huang

協調密SLAMは、マルチロボットチームが大規模な屋外環境でスケーラブルかつ一貫した3D認識を実現するために不可欠です。既存のシステムは通常、深度センサに依存しており、ペイロード、電力、校正コストが大幅に増加します。単眼RGBカメラは軽量な代替手段ですが、協調単眼密SLAMは、スケールの曖昧さやエージェント間のデータ関連付けの信頼性低さ、特に低オーバーラップや反復構造により従来の特徴マッチングが信頼できない屋外シーンにおいて、困難が残っていました。

これらの課題に対処するため、研究者らはCoMo3R-SLAMを提案します。これは、ロバストな学習済みフィードフォワード3D再構成事前分布を活用する初の協調単眼密RGB SLAMシステムであり、屋外マルチエージェントマッピングを目的としています。システムアーキテクチャは、各エージェントがリアルタイム追跡と局所密融合を行う事前分布誘導フロントエンドと、コーディネータが密ポイントマップマッチングによるエージェント間検証、閉形式Sim(3)ゲージ同期、GPU高速化グローバルバンドル調整とセグメントレベル深度最適化を実行する部分に分かれています。深度センサやパラメトリック内部パラメータを必要とせず、単眼RGBのみからロバストなエージェント間制約とグローバル一貫性のあるメトリックマップを生成します。

Tanks and TemplesおよびWaymoデータセットでの評価では、CoMo3R-SLAMはTanks and Templesの4シーンのうち3シーンで最良のATEを達成し、Waymoでも競争力のある精度を示し、最先端のRGB-D手法に匹敵または凌駕しつつ、オンラインで8 FPSの動作を実現しました。この成果は、マルチロボット屋外3D認識システムのハードウェア要件を大幅に削減し、軽量で低コストな協調SLAMへの新たな道を開くものです。本論文は2026年5月28日にarXivに投稿され(arXiv:2605.30488)、Zhihao Cao氏を含む7名の著者によるものです。今後の展開として、より多くのエージェントへの拡張、動的環境への対応、リアルタイム性能のさらなる最適化などが期待されます。