2026-05-26 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AcroRL：使用雙向推力學習激進的四旋翼翻轉

本文提出了一種基於強化學習的框架，透過調變恆定參考軌跡實現緊湊、位置受限的四旋翼翻轉，並與傳統軌跡生成和跟蹤相容。在模擬中，該方法相比最強最佳化基線，位置均方根誤差降低32%，穩定時間減少57%。硬體實驗在多種偏航配置下成功翻轉，位置均方根誤差低於0.35米。

來源arXiv Robotics作者: Gabriel Rodriguez, Henri Sayag, Abhishek Rathod, John Stecklein, Siddharth Saha, Christopher Barngrover, Wennie Tabib

來自arXiv的最新研究提出了一種名為AcroRL的框架，旨在利用雙向推力實現四旋翼飛行器的激進翻轉機動。雙向推力允許四旋翼在倒置狀態下保持平衡，從而擴充套件了其機動能力，包括倒飛、棲息和感測。傳統的幾何控制方法雖然能夠支援雙向推力，但在執行器飽和和電機反轉延遲方面存在困難，需要啟發式的推力姿態排程和航點調整。

為了克服這些挑戰，研究人員提出了一種基於學習的方法，透過調變恆定參考軌跡來執行緊湊且位置受限的翻轉。該方法分別訓練了兩個策略：一個用於從正常狀態過渡到倒置狀態，另一個用於從倒置狀態恢復到正常狀態。這種分而治之的策略使得模型能夠專注於每個階段的特定動力學特性。在基於JAX的模擬環境中，AcroRL在所有評估基線中實現了最低的位置偏差和穩定時間。與最強的基於最佳化的基線相比，位置均方根誤差降低了32%，穩定時間減少了57%。這一顯著提升得益於強化學習對複雜非線性動力學的適應能力。

硬體實驗進一步驗證了該方法的實用性。在多種偏航配置下，四旋翼成功完成了翻轉，位置均方根誤差低於0.35米。此外，該方法與下游軌跡生成和控制相容，例如在正常和倒置狀態下都能進行圓形飛行。研究人員還提供了該框架的開源實現，以促進進一步的開發和應用。這些結果表明，AcroRL為四旋翼執行激進機動提供了一種可靠且通用的解決方案。