AeroCast: 基于Transformer-MDN架构的非合作空中障碍物概率三维轨迹预测
AeroCast是一个概率性轨迹预测框架,结合了Transformer编码器和混合密度网络,用于预测未来三维位移的高斯混合分布。在混合真实与合成的四旋翼飞行器数据集上,相比基线方法,平均位移误差和最终位移误差降低了约50%,每个样本推理时间仅0.1毫秒,支持机载实时部署。
在共享空域中飞行的自主飞行器必须提前预测非合作障碍物的未来位置,以避免不可避免的碰撞。与共享意图的合作系统不同,非合作障碍物(如鸟类、失控无人机或碎片)的运动具有多模态特性,确定性预测器无法充分表示。现有方法要么依赖循环编码器逐步传播时间信息,限制了对机动启动前长程运动学前兆的捕捉能力,要么仅产生点预测,无法为下游规划器提供分布信息。
本文提出的AeroCast是一种概率性轨迹预测框架,它结合了Transformer编码器和混合密度网络(MDN)输出头,为每个时间步预测未来三维位移的高斯混合分布。为了解决混合模型在航迹预测中特有的输入设计和模式退化挑战,作者提出了一种平移不变连续位移编码和面向校准的训练目标。该方法不仅能够捕捉长程依赖关系,还能提供丰富的概率分布信息,这对于下游的规划和控制至关重要。
在涵盖九种运动类别的混合真实与合成四旋翼飞行器语料库上,AeroCast在五秒预测范围内将平均位移误差(ADE)和最终位移误差(FDE)相比基线降低了约50%,并在所有对比方法中取得了最低的负对数似然和连续排名概率评分(CRPS)。消融分析表明,速度输入和模型容量是预测质量的主要贡献因素,而位置编码对于长时域轨迹一致性至关重要。实验还验证了该方法对多模态运动模式的有效性,例如鸟类突然转向或无人机失控后的随机漂移。
AeroCast的推理速度极快,每样本仅需0.1毫秒,这使其能够以100Hz的频率在机载计算机上实时运行。这种高效性得益于Transformer的并行计算能力和轻量化的MDN输出头。相比之下,基于循环网络的方法由于序列处理限制了吞吐量,而AeroCast则突破了这一瓶颈。
这项研究为自主飞行系统中的非合作障碍物规避提供了高效且可部署的解决方案,尤其适用于无人机交通管理、城市空中机动等场景。作者已公开代码和数据以促进再现性和进一步研究。