arXiv Robotics AI ニュースソース

公開記事 318収集記事 350信頼度 75更新頻度 360 分

稼働状態正常ソース種別研究全文利用権限 全文利用可最終取り込み 2026-06-26ID arxiv-cs-ro状態有効

Use abstract and metadata; check individual paper license before full text.

最新公開記事

車輪付き四足ロボットのレーシング：モデル予測制御によるアクティブ荷重移動の抑制

2026-06-26 13:00 UTC+9

本論文は、モデル予測制御（MPC）と強化学習（RL）を用いた階層型制御フレームワークを提案し、車輪付き四足ロボットの自律レーシングにおける横方向荷重移動を能動的に管理する。フレームワークは、オフラインでの時間最適レースライン生成、オンラインMPCプランナー、および16のアクチュエータに直接展開される全身RLポリシーで構成される。実機実験により、アクティブロール制御により平均LTRが最大44%低減、最速ラップタイムが8.7%向上、ピーク横加速度が21.3%向上し1.98 m/s²に達し、高速安定性が向上することが示された。

MPCとRLを組み合わせた階層型制御フレームワーク
脚アクチュエータがアクティブサスペンションとして機能し、膝関節で反ロールトルクを生成

NavIsaacLab: 並列ロボット学習による現実的な群衆生成と人間を意識したナビゲーションのベンチマーキング

2026-06-26 13:00 UTC+9

NavIsaacLabは、Isaac Labに基づくフレームワークで、物理ベースかつフォトリアリスティックな歩行者とシーンのシミュレーションを提供し、GPU並列シミュレーションによりリアルタイムの3D視覚フィードバックを実現します。軌道拡散モデルと敵対的動作学習コントローラを用いたデータ駆動型アプローチにより、制御可能で物理ベースの歩行者シミュレーションを可能にし、多様なクロススケールシーンを統合することで、人間を意識したナビゲーション手法の強固なベンチマークを提供します。

NavIsaacLabは、フォトリアリスティックなレンダリングとGPU並列シミュレーションにより、リアルタイムの3D視覚フィードバックを提供。
軌道拡散モデルと敵対的動作学習コントローラを用いて、現実的かつ制御可能な歩行者運動を実現。

TaskNPoint：ヒューマノイドにバックハンドを数分で教える方法

2026-06-26 13:00 UTC+9

本論文は、人間のコーチによる少数の入力（スキルセット、1回のデモ、インタラクションウィンドウ、目標）を用いて、ヒューマノイドロボットが動的スキルを迅速に習得できるTaskNPointトレーニングプロトコルを提案する。Unitree G1ヒューマノイドでテニスストローク、サッカーキック、ボックスピックアンドプレイスなどのタスクを1時間未満のトレーニングで成功させた。

TaskNPointはコーチと学習者の役割分担を明確にし、人間は4つの入力のみを提供。
動的スキルの構造的特性を利用し、重要なインタラクションウィンドウの習得に焦点。

RoboTales：ロボット擬人化学習システム

2026-06-26 13:00 UTC+9

RoboTalesは、表現力豊かな靴下人形を使った物語をアニメーション化する低コストのロボットストーリーテリングシステムです。Baxterロボットに自律的に実装されたテストケースでは、ナレーション、ジェスチャー、口の動きを同期させてキャラクター主導のストーリーを演じます。パイロット研究では、人形ベースのストーリーテリングがジェスチャーのみのモードを上回り、HRIES評価とストーリー想起が向上し、具現化された人形劇がエンゲージメントと物語理解を高めることが示唆されました。モジュール式でプラットフォームに依存しない設計により、他のマニピュレータにも適応可能で、受動的メディアに代わるスクリーンフリーの選択肢を提供し、子ども中心の学習環境での将来の展開を支援します。

RoboTalesは表現力豊かな靴下人形を使用した低コストロボットストーリーテリングシステム。
Baxterロボット上で自律実装され、ナレーション、ジェスチャー、口の動きを同期。

OmniContact: コンタクトフローによるメタスキルの連鎖で汎用的人型ロコ操作を実現

2026-06-26 13:00 UTC+9

本論文では、コンタクトフロー（CF）表現を核とする階層フレームワークOmniContactを提案。低レベルポリシーCF-Trackは統一スキルライブラリを学習し、高レベルモジュールCF-Genは将来のコンタクトフロー系列をヒューリスティックに合成する。運搬と押し積みタスクでそれぞれ98.7%と76.5%の成功率を達成し、ベースラインを大幅に上回る。VLMとの統合により意味的な複雑操作が可能。

コンタクトフローを共有インターフェースとするOmniContact階層フレームワークの提案
低レベルCF-Trackが模倣学習や強化学習でスキル獲得、高レベルCF-Genが将来のCF系列を合成

オンライン・ヤコビ誤差補償による対数螺旋連続アームの形態特異的閉ループ制御

2026-06-26 13:00 UTC+9

本論文では、対数螺旋連続アームのための初の形態特異的閉ループタスク空間制御フレームワークを提案する。セグメント化された腱駆動モデルとオンライン・ヤコビ誤差補償（Broyden更新とカルマンフィルタ）を用いて、正確でロバストな制御を実現し、シミュレーションにおいてセグメント一定曲率法を凌駕し、把持や障害物回避運動などの操作を可能にする。

対数螺旋形態に特化した初の閉ループ制御フレームワーク
解析的ヤコビ行列とオンライン誤差補償の組み合わせ

LiMoDE：動的エキスパート混合の視点から見るロボットの生涯操作の再考

2026-06-26 13:00 UTC+9

本論文では、ロボットの生涯操作における破滅的忘却とスキル転送の問題を解決するため、動的エキスパート混合（MoE）に基づく二段階学習スキームLiMoDEを提案する。第一段階ではマルチタスク事前学習で動的MoEを用いて事前知識を学習し、第二段階では生涯MoE適応メカニズムにより新しいタスクに適応する。シミュレーションと実世界のタスクで有効性を実証した。

LiMoDEは二段階学習：マルチタスク事前学習（動的MoE）とタスク適応（生涯MoE機構）。
動的MoEは動作情報に基づいて異種エキスパートを活性化し、短期操作を処理。

RMTL：強化学習によるマイクロタスク学習とVLM報酬を用いた長期操作

2026-06-26 13:00 UTC+9

本論文では、長期操作タスクを言語で記述されたマイクロタスクに分解し、エージェントがそれらを切り替えるように訓練するRMTL（Reinforced Micro-task Learning）を提案する。マルチビューVLM報酬、逆カリキュラム、階層的ポリシーを用いることで、単一プロンプトのVLM報酬よりも情報量の多い報酬信号を提供し、学習を高速化する。Fetch操作環境での実験により有効性が確認された。

単一プロンプトのVLM報酬は長い軌道の大部分で平坦であり、長期タスクでの初期進捗検出を妨げる。
RMTLはタスクをマイクロタスクに分解し、各タスクに独立した言語プロンプトを与え、エージェントがそれらを切り替えるように訓練する。

強化学習による模擬毛細血管内の自律型マイクロロボットのナビゲーションと介入

2026-06-26 13:00 UTC+9

研究者らは、物理的に忠実な毛細血管網のシミュレーションを開発し、深層強化学習エージェントを化学走性によりナビゲーションするよう訓練した。ナビゲーションの物理的限界を体系的にマッピングし、禁止領域を発見した。エージェントは複数の普遍的な戦略を自律的に発見し、再訓練なしで毛細血管流の遮断と再開を行い、健康なベースラインレベルに回復させた。

現実的な流体力学と赤血球動態を含む毛細血管網シミュレーションの開発
深層強化学習エージェントの化学走性によるナビゲーション成功

教師なしメモリ拡張ビデオトランスフォーマー：自律型農業ローバーの障害物検出

2026-06-26 13:00 UTC+9

本論文では、農業ローバー向けの完全教師なしリアルタイム障害物検出手法VMTADを提案する。トランスフォーマーアーキテクチャとメモリモジュールを用いて動的シーンを処理し、ナタネデータセットで検出AUC 0.973、セグメンテーションAUC 0.997を達成。軽量版は14ミリ秒で推論可能。

VMTADは動的な農業シーン向けの完全教師なしリアルタイム障害物検出手法。
メモリモジュールでビデオフレームの時間的コンテキストを活用し、ローバーの動きによる動的変化に対応。

自己中心視覚理解における二重に正しい予測を持つ低遅延視覚言語モデルに向けて

2026-06-25 13:00 UTC+9

本論文は、自己中心視覚理解における視覚言語モデル（VLM）の低遅延推論のために重み刈り込みを研究し、予測の正確性と証拠に基づくこと（二重に正しい予測）を両立させる手法を提案する。既存の刈り込み手法は証拠の位置特定を維持するが精度を低下させる傾向がある。提案手法は理由に基づく刈り込み戦略で証拠と決定を整合させ、自己中心ビデオベンチマークで最高精度と二重に正しい予測を達成した。

重み刈り込みにより人機協調タスクでのVLM遅延を低減
既存手法は証拠の位置特定を維持するが予測精度を低下

SwarmFly：UAV群れ実験設計と検証のためのシミュレーションプラットフォーム

2026-06-25 13:00 UTC+9

SwarmFlyはMATLABベースのオープンソースUAV群れシミュレーションプラットフォームで、既存ツールのメンテナンス不足、学習曲線の急峻さ、単一シナリオの問題を解決する。複数の協調モード、プラグインアーキテクチャ、リアルタイムマップを備え、8つの実験で精度、耐風性、障害回復、持続性、空域適合性を検証した。モジュール設計によりハードウェアインザループテストや大規模群れへの拡張が容易。

SwarmFlyはMATLABプラットフォームで、4つの群れ協調モード（リーダー追従、分散、異種中継、異種速度）をサポート
プラグインアーキテクチャにより、コアコードを変更せずに機能を追加可能

長期間ロボット制御のための視覚運動ポリシーにおける記憶検索

2026-06-25 13:00 UTC+9

本論文では、長期ホライゾンロボット制御のための注意機構を用いた記憶検索を備えた視覚運動ポリシーHALOを紹介し、模倣学習における擬似相関と誤差蓄積に対処する。

HALOは視覚言語モデルの事前知識を蒸留して擬似相関を抑制する。
HALOはスパースアテンションを使用して閉ループ制御における記憶誤差の蓄積を低減する。

因果関係に基づくパラメトリック制御バリア関数による安全なマルチビークルインタラクション

2026-06-25 13:00 UTC+9

本論文は、因果推論を組み込んだパラメトリック制御バリア関数（Parametric-CBF）を提案し、マルチビークル相互作用における安全制御の問題を解決する。因果推論をCBFに埋め込むことで、車両間の相互影響を明示的に推論し、既存手法の因果関係の特定困難性や過度に保守的な動作を克服する。学習された因果ベースParametric-CBFを用いた適応的安全制御器により、自車は周囲車両の行動予測に基づいて安全に反応でき、様々な相互作用の多いシナリオでタスク効率が大幅に向上することを示す。本論文はICRA 2026に採択された。

因果推論をパラメトリックCBFに組み込み、車両間の相互影響を明示的に扱う
最悪ケース分析による過度な保守性を回避し、タスク効率を向上

RGB：RL誘導型全身MPPIによる人型ロボット制御

2026-06-25 13:00 UTC+9

RGBフレームワークは、事前学習済みの強化学習ポリシーをサンプリング事前分布として利用し、モデル予測経路積分（MPPI）でオンライン補正することで、再学習なしに人型ロボットの全身ロバスト制御を実現。Unitree G1シミュレーションで280Hzの制御率を達成し、タスク精度が大幅に向上。

RGBはRLポリシーをMPPIのサンプリング事前分布として使用し、コスト関数の調整のみで新目標を追加可能。
MPPIがオンラインでRL事前分布を補正し、歩行ドリフトを抑制し全身参照信号を追跡。

AeroCast: Transformer-MDNアーキテクチャによる非協力的空中障害物の確率的3D軌道予測

2026-06-25 13:00 UTC+9

AeroCastは、Transformerエンコーダと混合密度ネットワークを組み合わせた確率的軌道予測フレームワークで、将来の3D変位のガウス混合分布を予測します。ハイブリッドな実・合成クアッドコプターコーパスにおいて、ベースラインと比較して平均変位誤差と最終変位誤差を約50%削減し、サンプルあたり0.1ミリ秒の推論時間でリアルタイムオンボード展開を実現します。

Transformerエンコーダと混合密度ネットワークを組み合わせ、非協力的障害物の確率的3D軌道予測を実現。
5秒先の予測において、平均変位誤差と最終変位誤差をベースライン比約50%削減。

SurveilNav: ロボットと監視システムによる協調的オブジェクト目標ナビゲーション

2026-06-25 13:00 UTC+9

工場やオフィスでの監視システムの普及に伴い、ロボットとの統合が協調的なタスク実行の有望な方向性として注目されている。本研究では、屋内協調物体ナビゲーションのための新しいデータセットとフレームワークSurveilNavを提案。アクティブカメラスケジューリング、2D/3Dマッピング、VLMベースの価値推定、協調目標検証を統合し、HM3Dデータセットで最先端の性能を達成した。

74フロアに206台のカメラを配置した新しい協調ナビゲーションデータセット
ロボットの動的局所知覚と監視の静的全体視点を融合するSurveilNavフレームワーク

ADM-Fusion：多様な条件下でのロバストな自己運動推定のための適応型深層マルチセンサフュージョン

2026-06-25 13:00 UTC+9

ADM-Fusionを提案。エンドツーエンドの深層学習に基づくマルチセンサ融合手法で、適応型センサ混合エキスパートフレームワークとコンテンツ認識ルーティングを採用し、センサ入力を動的に重み付けする。並進と回転の分岐を分離し、クロスタスク注意機構で結合。CARLA-LOCシミュレーションデータセットで訓練し、KITTI実データで微調整。シミュレーションから現実への効果的な転移を示し、劣化条件下でのロバスト性を維持しながら既存手法と同等の性能を発揮。

コンテンツ認識ルーティングを用いた適応型センサ混合エキスパートによるリアルタイム動的重み付け。
並進と回転の独立した分岐とクロスタスク注意機構によるタスク特化と情報共有。

多IMU関節剛体システムにおける拡張姿勢推定のための不変カルマンフィルタリング

2026-06-25 13:00 UTC+9

本研究では、多IMU関節剛体システムの拡張姿勢推定のための新しい不変カルマンフィルタリング手法を提案する。相対L拡張姿勢リー群表現を導入し、関節運動学的制約をノイズフリーの擬似測定として反復型IEKFに組み込むことで、UR5eロボットと人間の脚部において、既存フィルタと比較して収束が速く、RMSEが50%以上削減される。

各剛体に1つのIMUを持つ運動学ツリーシステムのための相対L拡張姿勢リー群表現を提案
関節制約をノイズフリーの擬似測定として反復型IEKFに組み込み、収束性と一貫性を維持

BFMTrack：行動基盤モデルを用いた物理ベースモーション追跡のための潜在系列最適化

2026-06-25 13:00 UTC+9

潜在系列最適化（LSO）と呼ばれる新しい手法により、行動基盤モデル内の潜在変数の系列を最適化することで、正確な物理ベースのモーション追跡を実現し、実人型ロボットで検証されました。

行動基盤モデル（BFM）は物理的に妥当な行動を潜在空間に整理するが、時間変動する目的を直接サポートしない。
BFMTrackはシミュレーションロールアウトと方策勾配更新を組み合わせたLSOを導入する。

NavWM: 先見的計画のための統一ナビゲーションワールドモデル

2026-06-24 13:00 UTC+9

NavWMは、潜在世界推論、マルチモーダル行動予測、制御可能な視覚生成をシームレスに統合した統一ナビゲーションワールドモデルです。アンカーベースのマルチモーダル軌道予測フレームワークを導入し、多様な行動空間を生成し、視覚的先見性を活用した堅牢な閉ループ計画を実現します。実験により、高忠実度の将来状態生成とゼロショットナビゲーション成功率の大幅な向上が示されています。

NavWMは知覚、生成、制御を統合し、時空間ダイナミクスを一元的に扱います。
潜在世界トークンにより幾何学的・意味的先験知識を抽出し、構造理解を強化。

DynaWM：力学認識型蒸留と世界モデル・モメンタムターゲットによる連続階段上の滑らかな移動

2026-06-24 13:00 UTC+9

DynaWMは世界モデル正則化とモメンタムターゲットエンコーダにより、二足車輪ロボットの連続階段における地形適応性と動作の滑らかさを向上。シミュレーションと実機で有効性を確認。

世界モデルを正則化項として導入し、前方力学認識を強制し地形幾何を保持。
モメンタムターゲットエンコーダで一貫した蒸留ターゲットを提供し、次元崩壊を防止。

MinInter: 模倣学習におけるデータ拡張時の軌道補間を最小化

2026-06-24 13:00 UTC+9

MinInterは、補間を最小限に抑えることで高品質な合成データを生成し、模倣学習の性能を向上させる手法です。MimicGenベンチマークの12の操作タスクにおいて、データ生成成功率と方策成功率を一貫して改善し、特に接触を伴う長期間のタスクで大きな効果を示しました。

MinInterは初期状態ごとに最も補間の少ないデモンストレーションを選択します。
MimicGenベンチマークの12タスクで成功率を一貫して向上。

SPACE：クロスロボットデータからの学習を可能にする汎用ポリシーへのフレームワーク

2026-06-24 13:00 UTC+9

SPACEフレームワークは、カルテシアン状態デルタを普遍的な動作表現として使用し、状態予測と適応型コマンド実行により、異なるロボット間での動作クローニングの問題を解決する。実験では、直接的なコマンド予測よりも優れた性能を示し、動的変化に対して頑健である。

カルテシアン状態デルタを普遍的な動作表現として提案
異なるエンボディメント、ハードウェアユニット、単一ロボット内の変動に対応

TurboMPC：GPU上での高速・スケーラブル・微分可能なモデル予測制御

2026-06-24 13:00 UTC+9

TurboMPCはGPU上で完全に動作する微分可能なMPCソルバーで、状態・制御不等式制約、陰的積分器、時間横断結合コスト、スラック変数をサポートします。SQP、ADMM、陰的微分、JAX-CUDA実装を組み合わせ、シミュレーションではCPUソルバー比15倍、GPUソルバー比58倍の高速化を達成。実車レースではベイズ最適化によるGPU高速化チューニングが手動調整を凌駕し、8000以上のノットポイントまでスケール可能です。

GPU完全対応の微分可能MPCソルバー
CPU比15倍、GPU比58倍の高速化

シミュレートから実世界への賭け(E-Process)：いつでも有効な信頼区間に「シミュレータ」をもたらす

2026-06-24 13:00 UTC+9

本ノートでは、シミュレートから実世界への性能推定とベッティング（Chenら）、および安全ないつでも有効な推論（Ramdasら）を統合する方法を説明する。スケーリングされたシミュレータを用いて、平均推定のための効率的で信頼性の高い証明書を生成し、ロボット性能テストで特に価値がある。

シミュレートから実世界への性能推定とベッティングを統合
スケーリングされたシミュレータを用いて効率的な平均推定証明書を生成

変位ベースの編隊制御のためのトポロジカルオンライン学習

2026-06-24 13:00 UTC+9

本論文では、相互作用トポロジの重みをオンラインで更新し編隊の歪みを最小化するリアルタイムエッジレベル適応フレームワークTOLDを提案。従来のノードレベルロバスト制御器を凌ぐ性能を示し、Crazyflie 2.0クアッドローターでの実験ではOGFで62%超の歪み低減を達成。

TOLDは個々のロボット入力を調整するのではなく、相互作用トポロジの重みをオンラインで調整する初の編隊制御手法。
OGF（無制約重み）とOExpGF（非負凸重み）の2戦略を提案。OExpGFは漸近的コンセンサスを保証。

対抗的姿勢正則化による器用なピアノ演奏における人間らしい運動学の実現

2026-06-24 13:00 UTC+9

強化学習は物理シミュレーションで両手の器用なロボットハンドに高精度でピアノを弾かせることができるが、高自由度の手ではタスク報酬や逆運動学のみに頼ると不自然な姿勢や関節の過伸展が生じる。本論文では、対抗的姿勢正則化（APR）を提案する。これは高価な曲合わせの専門家デモデータを必要とせず、少量の日常的な人間の演奏データを使用する。敵対的目標を通じてポリシーの姿勢分布を人間の事前分布に一致させることで、より人間らしい手の形状を促す。また、コンシューマ向けMeta Quest 3を用いて非構造化の手の動きデータを収集・公開し、Shadow Handに主要な動き情報をリターゲティングする。3つの人間らしさ指標（cPSI、BSE、FAC）と視覚品質で先行手法を大幅に上回る性能を達成した。

対抗的姿勢正則化（APR）を提案し、高価な専門家デモデータなしで人間らしい手の姿勢を実現
Meta Quest 3を用いて日常的なピアノ演奏の手の動きデータを収集し、Shadow Handにリターゲティング

信頼性の高い自律システムの工学：課題と解決策

2026-06-24 13:00 UTC+9

本稿は、2024年6月10日から14日に開催されたローレンツセンター・ワークショップ「Engineering Reliable Autonomous Systems (ERAS)」の議論をまとめたものです。自律システムの検証・妥当性確認、実世界での工学、安全なソフトウェアアーキテクチャに焦点を当て、課題のカタログと解決への道筋を示しています。一部の課題は、学術的に知られているが実践ではまだ普及していない技術で対処可能であり、その他の課題はさらなる研究を必要とします。

FMASとAREAコミュニティが共同で主催し、学界、産業界、専門分野の代表者が集まった。
三つの主要テーマ：検証・妥当性確認、実世界システムの工学、安全なソフトウェアアーキテクチャ。

検証可能なロボット安全のための基盤モデル

2026-06-24 13:00 UTC+9

本論文では、ロボットポリシーを大規模コントローラと小型安全モジュールに分解するFEARLフレームワークを提案し、基盤モデルの表現力を維持しつつ安全クリティカルな特性の形式的検証を可能にする。シミュレーションと実機ロボットでの実験で有効性を示した。

FEARLはロボットポリシーを、知覚・推論を担う大規模コントローラと検証可能な安全モジュールに分割する。
安全モジュールは低次元センサーデータのみを扱うため、形式的検証が実用的になる。

arXiv Robotics

最新公開記事

車輪付き四足ロボットのレーシング：モデル予測制御によるアクティブ荷重移動の抑制

NavIsaacLab: 並列ロボット学習による現実的な群衆生成と人間を意識したナビゲーションのベンチマーキング

TaskNPoint：ヒューマノイドにバックハンドを数分で教える方法

RoboTales：ロボット擬人化学習システム

OmniContact: コンタクトフローによるメタスキルの連鎖で汎用的人型ロコ操作を実現

オンライン・ヤコビ誤差補償による対数螺旋連続アームの形態特異的閉ループ制御

LiMoDE：動的エキスパート混合の視点から見るロボットの生涯操作の再考

RMTL：強化学習によるマイクロタスク学習とVLM報酬を用いた長期操作

強化学習による模擬毛細血管内の自律型マイクロロボットのナビゲーションと介入

教師なしメモリ拡張ビデオトランスフォーマー：自律型農業ローバーの障害物検出

自己中心視覚理解における二重に正しい予測を持つ低遅延視覚言語モデルに向けて

SwarmFly：UAV群れ実験設計と検証のためのシミュレーションプラットフォーム

長期間ロボット制御のための視覚運動ポリシーにおける記憶検索

因果関係に基づくパラメトリック制御バリア関数による安全なマルチビークルインタラクション

RGB：RL誘導型全身MPPIによる人型ロボット制御

AeroCast: Transformer-MDNアーキテクチャによる非協力的空中障害物の確率的3D軌道予測

SurveilNav: ロボットと監視システムによる協調的オブジェクト目標ナビゲーション

ADM-Fusion：多様な条件下でのロバストな自己運動推定のための適応型深層マルチセンサフュージョン

多IMU関節剛体システムにおける拡張姿勢推定のための不変カルマンフィルタリング

BFMTrack：行動基盤モデルを用いた物理ベースモーション追跡のための潜在系列最適化

NavWM: 先見的計画のための統一ナビゲーションワールドモデル

DynaWM：力学認識型蒸留と世界モデル・モメンタムターゲットによる連続階段上の滑らかな移動

MinInter: 模倣学習におけるデータ拡張時の軌道補間を最小化

SPACE：クロスロボットデータからの学習を可能にする汎用ポリシーへのフレームワーク

TurboMPC：GPU上での高速・スケーラブル・微分可能なモデル予測制御

シミュレートから実世界への賭け(E-Process)：いつでも有効な信頼区間に「シミュレータ」をもたらす

変位ベースの編隊制御のためのトポロジカルオンライン学習

対抗的姿勢正則化による器用なピアノ演奏における人間らしい運動学の実現

信頼性の高い自律システムの工学：課題と解決策

検証可能なロボット安全のための基盤モデル

全ソース