2026-05-29 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

相位条件模仿学习与自主故障恢复：鲁棒的可变形物体操作

本文提出一种相位条件、力感知的框架，用于鲁棒的可变形物体操作。通过FiLM调节的ACT编码器和多模态相位预测器，系统能自主检测并恢复接触故障，将T恤悬挂成功率从56%提升至87%。

来源arXiv Robotics作者: Dayuan Chen, Kai Tang, Yukuan Zhang, Kazuhiro Kosuge, Yasuhisa Hirata

可变形物体操作（如衣物处理）是机器人领域的长期挑战，因其具有高自由度、非刚性特性和复杂接触交互。近日，一篇发表于IEEE/ASME Transactions on Mechatronics的论文提出了一种名为“Phase-Conditioned Imitation Learning with Autonomous Failure Recovery”的新型框架，旨在通过相位条件模仿学习和自主故障恢复，显著提升机器人在此类任务中的鲁棒性。

论文作者指出，主流的模仿学习方法，如Action Chunking with Transformers（ACT），在推理时依赖马尔可夫假设，即当前观测仅依赖于上一时刻状态。然而，当视觉上相似的观测需要相互矛盾的动作时，这一假设会导致状态混淆，且系统无法从执行故障中自主恢复。为解决这些问题，研究团队设计了一个闭环分层架构。

该架构的核心是一个FiLM（Feature-wise Linear Modulation）条件化的ACT编码器。FiLM根据当前任务阶段动态调整特征提取过程，使得单一统一策略能够产生阶段特定的行为，同时跨阶段共享动作动力学。此外，一个多模态相位预测器融合了视觉、力传感器和位姿反馈，实时估计当前阶段，并检测视觉上不可见的接触故障（例如衣物卡住或滑脱）。一旦检测到故障，系统会自动触发恢复轨迹，无需人为干预。

为了完成整个系统，研究团队还集成了混合阻抗控制器以实现柔顺执行，并开发了力觉遥操作界面用于收集具有力感知的训练数据。消融实验表明，FiLM基础调制显著优于无条件基线以及令牌级条件基线。t-SNE分析进一步证实，FiLM产生了分离良好的阶段特定特征表示。

在双臂平台上进行的T恤悬挂和移除验证实验中，闭环系统将悬挂成功率从56%大幅提升至87%，证明了自主错误恢复机制的有效性。该工作不仅为可变形物体操作提供了实用解决方案，也为模仿学习策略的鲁棒性设计开辟了新思路。论文代码和演示视频已开源。