2026-07-03 12:00 UTC+8站内改写1 分钟阅读更新: 2026-07-03 16:24 UTC+8

基于约束流匹配的神经符号安全引导方法用于视觉-语言-动作模型

本文提出一种神经符号安全引导机制，用于基于流匹配的视觉-语言-动作（VLA）模型，实现预测性碰撞避免。该方法将安全执行表述为最小范数约束优化问题，在迭代去噪过程中纠正轨迹预测中的安全违规。在SafeLIBERO基准测试中，该方法实现了82.8%的碰撞避免率和81.6%的任务成功率，分别比单步方法提高6.3%和19.8%，尤其擅长长时域任务。

来源arXiv Robotics作者: William English, Hao Zheng, Rickard Ewetz

视觉-语言-动作（VLA）模型在机器人操作任务中展现出强大的泛化能力，但实际部署中因缺乏有效的安全措施而受限。现有方法仅能防止由机器人下一个动作引发的碰撞，无法预见整个规划轨迹中的潜在风险。为解决这一问题，本文提出一种神经符号安全引导机制，专门针对基于流匹配的VLA模型，实现预测性碰撞避免。

流匹配VLA模型通过迭代神经流匹配过程预测完整轨迹（一系列动作），并据此决定下一个动作。该方法将安全执行形式化为一个最小范数约束优化问题：在每一步去噪过程中，对噪声中间轨迹预测进行符号约束修正，纠正安全违规。通过分析预测轨迹并在迭代去噪中应用修正，该方法能够在碰撞变得不可避免之前提前预判。这种符号约束满足与神经轨迹生成的交替，实现了预测性而非反应性的碰撞避免。

在SafeLIBERO基准测试上，该方法达到了82.8%的碰撞避免率和81.6%的任务成功率，分别比单步安全方法提高了6.3%和19.8%。性能提升在长时域任务上最为显著，因为这类任务中复合分布偏移最为突出。此外，该方法在保持高任务成功率的同时有效避免碰撞，表明神经符号交织是一种可行且有效的安全框架。作者提供了项目页面，包含视频演示：https://willenglish.tech/SafetyGuidedFlowMatching/。

与现有单步安全方法相比，本文方法能够考虑整个预测轨迹，从而提前识别并规避累积误差导致的碰撞。通过最小范数约束，修正信号对原始轨迹的影响最小化，保证了任务执行的稳定性。该研究为VLA模型的安全部署提供了新思路，未来可扩展到更复杂的机器人系统和场景。