DiffSlack:基于可学习松弛变量的非线性不等式约束学习
DiffSlack提出一种可微投影层,通过可学习的松弛变量将不等式约束转化为等式,从而在神经网络中高效实施非线性不等式约束。该方法在具有200个非线性约束的车辆路径规划任务中,相比基线方法实现了更高的规划成功率和更强的几何约束满足能力,并在CARLA仿真和真实车辆实验中验证了其轨迹的可执行性。
在工程应用中,许多神经网络预测任务需要满足复杂的非线性不等式约束,例如机器人运动规划和自动驾驶路径生成。然而,现有硬约束方法通常对约束集合施加结构限制,或在大规模非线性问题上引入巨大计算开销。为此,Ziqian Wang等研究者提出DiffSlack——一种可微投影层,能够将非线性不等式约束高效嵌入神经网络。
DiffSlack的核心创新在于将不等式约束重新表述为带可学习松弛变量的等式。这些松弛变量作为网络增强输出的一部分被预测,并为投影过程提供数据驱动的初始值。随后,阻尼高斯-牛顿法将原始预测映射到增广可行流形上,同时保持端到端可微性。此外,论文引入两阶段课程学习策略,用于稳定训练并提升约束满足率。
研究者在车辆路径规划任务上评估了DiffSlack,该任务包含200个非线性不等式约束,涉及碰撞避免、曲率限制和路径点间距。与现有基于学习的基线方法相比,DiffSlack在相近推理预算下实现了更高的规划成功率和更强的几何约束满足能力。消融实验表明,硬投影层降低了对监督质量的敏感性,使得即便在低质量标注下也能维持良好性能。
为验证实际可行性,研究者进一步在CARLA仿真环境以及真实车辆平台上进行了闭环跟踪实验。结果表明,DiffSlack生成的轨迹在执行层面完全可行,车辆能够平滑行驶并成功规避障碍。这些成果证明,DiffSlack为在神经网络中嵌入硬不等式约束提供了一种实用且可扩展的方案,有望推动相关工程应用的进步。