基于约束流匹配的神经符号安全引导方法用于视觉-语言-动作模型
本文提出一种神经符号安全引导机制,用于基于流匹配的视觉-语言-动作(VLA)模型,实现预测性碰撞避免。该方法将安全执行表述为最小范数约束优化问题,在迭代去噪过程中纠正轨迹预测中的安全违规。在SafeLIBERO基准测试中,该方法实现了82.8%的碰撞避免率和81.6%的任务成功率,分别比单步方法提高6.3%和19.8%,尤其擅长长时域任务。
视觉-语言-动作(VLA)模型在机器人操作任务中展现出强大的泛化能力,但实际部署中因缺乏有效的安全措施而受限。现有方法仅能防止由机器人下一个动作引发的碰撞,无法预见整个规划轨迹中的潜在风险。为解决这一问题,本文提出一种神经符号安全引导机制,专门针对基于流匹配的VLA模型,实现预测性碰撞避免。
流匹配VLA模型通过迭代神经流匹配过程预测完整轨迹(一系列动作),并据此决定下一个动作。该方法将安全执行形式化为一个最小范数约束优化问题:在每一步去噪过程中,对噪声中间轨迹预测进行符号约束修正,纠正安全违规。通过分析预测轨迹并在迭代去噪中应用修正,该方法能够在碰撞变得不可避免之前提前预判。这种符号约束满足与神经轨迹生成的交替,实现了预测性而非反应性的碰撞避免。
在SafeLIBERO基准测试上,该方法达到了82.8%的碰撞避免率和81.6%的任务成功率,分别比单步安全方法提高了6.3%和19.8%。性能提升在长时域任务上最为显著,因为这类任务中复合分布偏移最为突出。此外,该方法在保持高任务成功率的同时有效避免碰撞,表明神经符号交织是一种可行且有效的安全框架。作者提供了项目页面,包含视频演示:https://willenglish.tech/SafetyGuidedFlowMatching/。
与现有单步安全方法相比,本文方法能够考虑整个预测轨迹,从而提前识别并规避累积误差导致的碰撞。通过最小范数约束,修正信号对原始轨迹的影响最小化,保证了任务执行的稳定性。该研究为VLA模型的安全部署提供了新思路,未来可扩展到更复杂的机器人系统和场景。