2026-05-26 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

AcroRL：使用双向推力学习激进的四旋翼翻转

本文提出了一种基于强化学习的框架，通过调制恒定参考轨迹实现紧凑、位置受限的四旋翼翻转，并与传统轨迹生成和跟踪兼容。在仿真中，该方法相比最强优化基线，位置均方根误差降低32%，稳定时间减少57%。硬件实验在多种偏航配置下成功翻转，位置均方根误差低于0.35米。

来源arXiv Robotics作者: Gabriel Rodriguez, Henri Sayag, Abhishek Rathod, John Stecklein, Siddharth Saha, Christopher Barngrover, Wennie Tabib

来自arXiv的最新研究提出了一种名为AcroRL的框架，旨在利用双向推力实现四旋翼飞行器的激进翻转机动。双向推力允许四旋翼在倒置状态下保持平衡，从而扩展了其机动能力，包括倒飞、栖息和传感。传统的几何控制方法虽然能够支持双向推力，但在执行器饱和和电机反转延迟方面存在困难，需要启发式的推力姿态调度和航点调整。

为了克服这些挑战，研究人员提出了一种基于学习的方法，通过调制恒定参考轨迹来执行紧凑且位置受限的翻转。该方法分别训练了两个策略：一个用于从正常状态过渡到倒置状态，另一个用于从倒置状态恢复到正常状态。这种分而治之的策略使得模型能够专注于每个阶段的特定动力学特性。在基于JAX的仿真环境中，AcroRL在所有评估基线中实现了最低的位置偏差和稳定时间。与最强的基于优化的基线相比，位置均方根误差降低了32%，稳定时间减少了57%。这一显著提升得益于强化学习对复杂非线性动力学的适应能力。

硬件实验进一步验证了该方法的实用性。在多种偏航配置下，四旋翼成功完成了翻转，位置均方根误差低于0.35米。此外，该方法与下游轨迹生成和控制兼容，例如在正常和倒置状态下都能进行圆形飞行。研究人员还提供了该框架的开源实现，以促进进一步的开发和应用。这些结果表明，AcroRL为四旋翼执行激进机动提供了一种可靠且通用的解决方案。