AeroCast: Transformer-MDNアーキテクチャによる非協力的空中障害物の確率的3D軌道予測
AeroCastは、Transformerエンコーダと混合密度ネットワークを組み合わせた確率的軌道予測フレームワークで、将来の3D変位のガウス混合分布を予測します。ハイブリッドな実・合成クアッドコプターコーパスにおいて、ベースラインと比較して平均変位誤差と最終変位誤差を約50%削減し、サンプルあたり0.1ミリ秒の推論時間でリアルタイムオンボード展開を実現します。
共有空域を飛行する自律航空機は、衝突が不可避になる前に回避行動を計画するために、非協力的障害物の将来位置を予測しなければなりません。意図を共有する協調システムとは異なり、鳥、制御不能なドローン、または破片などの非協力的障害物は多峰性の運動を示し、決定論的予測器では適切に表現できません。既存の手法は、時系列情報を逐次伝播するリカレントエンコーダに依存し、機動開始の長距離運動学的前兆を捉える能力が制限されるか、分布情報を提供しない点予測を生成します。
本論文で提案するAeroCastは、Transformerエンコーダと混合密度ネットワーク(MDN)出力ヘッドを組み合わせた確率的軌道予測フレームワークであり、将来の3次元変位に対するタイムステップごとのガウス混合分布を予測します。並進不変な連続変位符号化とキャリブレーション指向の訓練目的関数は、混合モデルによる航空軌道予測に固有の入力設計とモード縮退問題に対処します。これにより、長距離の依存関係を捉え、下流のプランナーに豊富な確率分布情報を提供することが可能になります。
9つの運動カテゴリにわたるハイブリッドな実・合成クアッドコプターコーパスにおいて、AeroCastは5秒先の予測で平均変位誤差(ADE)と最終変位誤差(FDE)をベースラインと比較して約50%削減し、比較したすべての手法の中で最低の負の対数尤度と連続ランク確率スコア(CRPS)を達成しました。アブレーション分析は、速度入力とモデル容量が予測品質の主な貢献要因であり、位置符号化が長距離軌道の一貫性に不可欠であることを特定しました。また、鳥の突然の方向転換やドローンの制御不能後のランダムな漂流など、多様な運動モードに対する有効性も確認されています。
AeroCastの推論はサンプルあたり0.1ミリ秒で完了し、100Hzでのリアルタイムオンボード展開に適合します。この高速性は、Transformerの並列計算能力と軽量なMDN出力ヘッドによるものです。リカレントネットワークベースの手法がシーケンシャル処理によりスループットを制限されるのに対し、AeroCastはこのボトルネックを克服しています。
この研究は、自律飛行システムにおける非協力的障害物回避のための効率的で展開可能なソリューションを提供し、特にドローン交通管理や都市空中モビリティなどのシナリオに適用可能です。著者らは再現性とさらなる研究のためにコードとデータを公開しています。