相位条件模仿学习与自主故障恢复:鲁棒的可变形物体操作
本文提出一种相位条件、力感知的框架,用于鲁棒的可变形物体操作。通过FiLM调节的ACT编码器和多模态相位预测器,系统能自主检测并恢复接触故障,将T恤悬挂成功率从56%提升至87%。
文章情报
要点
- 标准模仿学习(如ACT)因马尔可夫假设导致状态混淆,无法自主恢复执行故障。
- 本文采用FiLM条件编码器,使单一策略在不同任务阶段产生特定行为。
- 多模态相位预测器融合视觉、力和位姿反馈,实时检测接触故障并触发恢复轨迹。
- 在双臂T恤悬挂和移除任务中,成功率从56%提升至87%。
为什么重要
这条新闻值得关注,因为标准模仿学习(如ACT)因马尔可夫假设导致状态混淆,无法自主恢复执行故障。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
可变形物体操作(如衣物处理)是机器人领域的长期挑战,因其具有高自由度、非刚性特性和复杂接触交互。近日,一篇发表于IEEE/ASME Transactions on Mechatronics的论文提出了一种名为“Phase-Conditioned Imitation Learning with Autonomous Failure Recovery”的新型框架,旨在通过相位条件模仿学习和自主故障恢复,显著提升机器人在此类任务中的鲁棒性。
论文作者指出,主流的模仿学习方法,如Action Chunking with Transformers(ACT),在推理时依赖马尔可夫假设,即当前观测仅依赖于上一时刻状态。然而,当视觉上相似的观测需要相互矛盾的动作时,这一假设会导致状态混淆,且系统无法从执行故障中自主恢复。为解决这些问题,研究团队设计了一个闭环分层架构。
该架构的核心是一个FiLM(Feature-wise Linear Modulation)条件化的ACT编码器。FiLM根据当前任务阶段动态调整特征提取过程,使得单一统一策略能够产生阶段特定的行为,同时跨阶段共享动作动力学。此外,一个多模态相位预测器融合了视觉、力传感器和位姿反馈,实时估计当前阶段,并检测视觉上不可见的接触故障(例如衣物卡住或滑脱)。一旦检测到故障,系统会自动触发恢复轨迹,无需人为干预。
为了完成整个系统,研究团队还集成了混合阻抗控制器以实现柔顺执行,并开发了力觉遥操作界面用于收集具有力感知的训练数据。消融实验表明,FiLM基础调制显著优于无条件基线以及令牌级条件基线。t-SNE分析进一步证实,FiLM产生了分离良好的阶段特定特征表示。
在双臂平台上进行的T恤悬挂和移除验证实验中,闭环系统将悬挂成功率从56%大幅提升至87%,证明了自主错误恢复机制的有效性。该工作不仅为可变形物体操作提供了实用解决方案,也为模仿学习策略的鲁棒性设计开辟了新思路。论文代码和演示视频已开源。