AI News HubLIVE
站內改寫1 分鐘閱讀

AeroCast: 基於Transformer-MDN架構的非合作空中障礙物概率三維軌跡預測

AeroCast是一個概率性軌跡預測框架,結合了Transformer編碼器和混合密度網絡,用於預測未來三維位移的高斯混合分佈。在混合真實與合成的四旋翼飛行器數據集上,相比基線方法,平均位移誤差和最終位移誤差降低了約50%,每個樣本推理時間僅0.1毫秒,支持機載實時部署。

來源arXiv Robotics作者: Syed Izzat Ullah, Jose Baca

在共享空域中飛行的自主飛行器必須提前預測非合作障礙物的未來位置,以避免不可避免的碰撞。與共享意圖的合作系統不同,非合作障礙物(如鳥類、失控無人機或碎片)的運動具有多模態特性,確定性預測器無法充分表示。現有方法要麼依賴循環編碼器逐步傳播時間信息,限制了對機動啓動前長程運動學前兆的捕捉能力,要麼僅產生點預測,無法為下游規劃器提供分佈信息。

本文提出的AeroCast是一種概率性軌跡預測框架,它結合了Transformer編碼器和混合密度網絡(MDN)輸出頭,為每個時間步預測未來三維位移的高斯混合分佈。為了解決混合模型在航跡預測中特有的輸入設計和模式退化挑戰,作者提出了一種平移不變連續位移編碼和麪向校準的訓練目標。該方法不僅能夠捕捉長程依賴關係,還能提供豐富的概率分佈信息,這對於下游的規劃和控制至關重要。

在涵蓋九種運動類別的混合真實與合成四旋翼飛行器語料庫上,AeroCast在五秒預測範圍內將平均位移誤差(ADE)和最終位移誤差(FDE)相比基線降低了約50%,並在所有對比方法中取得了最低的負對數似然和連續排名概率評分(CRPS)。消融分析表明,速度輸入和模型容量是預測質量的主要貢獻因素,而位置編碼對於長時域軌跡一致性至關重要。實驗還驗證了該方法對多模態運動模式的有效性,例如鳥類突然轉向或無人機失控後的隨機漂移。

AeroCast的推理速度極快,每樣本僅需0.1毫秒,這使其能夠以100Hz的頻率在機載計算機上實時運行。這種高效性得益於Transformer的並行計算能力和輕量化的MDN輸出頭。相比之下,基於循環網絡的方法由於序列處理限制了吞吐量,而AeroCast則突破了這一瓶頸。

這項研究為自主飛行系統中的非合作障礙物規避提供了高效且可部署的解決方案,尤其適用於無人機交通管理、城市空中機動等場景。作者已公開代碼和數據以促進再現性和進一步研究。