2026-06-01 13:00 UTC+9サイト内リライト2 分で読了更新: 2026-06-30 22:03 UTC+9

屋内移動ロボットのための学習ベースナビゲーション

本論文は、教師ありニューラルグローバルプランナーと学習ベースのDWAローカルプランナーを組み合わせた屋内移動ロボットナビゲーションフレームワークを提案する。グローバルプランナーはコスト考慮型A*のエキスパート軌跡で訓練され、ローカルプランナーは行動模倣で初期訓練後、PPOで洗練される。シミュレーションと実環境での実験により、障害物回避のための実行可能な経路と信頼性の高い運動指令が生成されることを実証。ソースコードは公開予定。

ソースarXiv Robotics著者: Tri-Tin Nguyen, Tien-Dat Nguyen, Gia-Uy Le, Vinh Nguyen, Vinh-Hao Nguyen

新しい研究論文が、屋内移動ロボットのための学習ベースナビゲーションフレームワークを提案しました。このフレームワークは、教師ありニューラルグローバルプランナーと強化学習で最適化されたダイナミックウィンドウアプローチ（DWA）ローカルプランナーを組み合わせ、安全で効率的な障害物回避ナビゲーションを実現します。フレームワークの核心は二層構造にあります。大域計画では、コストを考慮したA*アルゴリズムで生成されたエキスパート軌跡を用いて教師ありニューラルネットワークを訓練し、スタートからゴールまでの実行可能な経路を計画します。局所計画では、学習型DWAプランナーを提案し、DWA動作空間上の離散的な候補選択として定式化しました。このプランナーはまず行動模倣（behavior cloning）で初期訓練され、その後、近接政策最適化（PPO）アルゴリズムで洗練されます。その際、実現可能性を考慮したマスキングを導入し、衝突や運動学的制約の違反を防ぎます。

研究チームは、シミュレーション環境と実際の室内環境の両方でフレームワークを評価しました。シミュレーション実験では、さまざまな室内レイアウトと障害物配置を使用し、大域経路の実現可能性と局所運動指令の信頼性を評価しました。実環境実験では、レーザーレンジファインダーとオドメトリを搭載した差動駆動移動ロボットプラットフォームを使用し、廊下や部屋、家具障害物を含むシナリオでテストしました。実験結果は、滑らかな大域経路を生成できるだけでなく、動的障害物（例えば歩行者）が存在する環境でも信頼性の高い低レベル運動指令を出力し、安全な目標指向ナビゲーションを実現することを示しました。従来のルールベース手法と比較して、学習型局所プランナーは未知のシナリオに対する柔軟性と適応性に優れ、例えば突然現れる障害物をより滑らかに回避できました。さらに、アブレーション研究により、実現可能性マスクとPPO微調整が性能向上に寄与することが確認されました。

著者らは、この研究が学習型大域計画と強化学習最適化された局所制御の統合の可能性を示し、屋内移動ロボットの自律ナビゲーションに有効かつ実用的なソリューションを提供すると述べています。この手法のモジュール設計は、他のロボットシステムへの拡張や統合を容易にします。関連ソースコードはプロジェクトウェブサイト（https://ntdathp.github.io/rl_robot_web/）で公開される予定であり、これにより当該分野の研究進展と応用展開が促進されることが期待されます。