2026-05-27 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

遥操作中的数据质量闭环：面向高质量示范采集的片段级评估与反馈

遥操作在机器人数据采集中至关重要，但新手操作员常产生虽任务成功但次优的示范。本文提出数据质量评估与反馈（DQAF）框架，通过即时反馈提升示范质量。

来源arXiv Robotics作者: Gokul Narayanan, Yash Shahapurkar, Melih Erdogan, Brian Zhu, Eugen Solowjow

工业自动化正处于关键转折点：物理人工智能正在推动从僵化、手工设计的自动化系统向更灵活、适应性更强的系统转变。这一转变催生了对大规模、真实世界机器人示范数据的巨大需求，使得遥操作成为日益重要的数据采集机制。然而，在实际中，高质量的遥操作示范仍然难以获得。新手操作员常常产生任务成功但下游使用次优的操作片段，原因包括运动效率低下、反复修正或接近机器人关节极限操作。

为了应对这一挑战，本文提出了数据质量评估与反馈框架（DQAF），该框架通过提供基于语义任务进度和机器人遥测的即时后片段反馈，在遥操作中实现了闭环。DQAF框架提取与质量相关的多种信号，如子任务进度、运动平滑度、停滞和运动学极限，并将其转化为结构化的质量评估和可操作的自然语言反馈。与仅告知成功或失败的二元反馈不同，该系统能够解释片段次优的原因，并突出显示在下一次尝试中需要纠正的具体行为。

研究人员的评估通过诊断验证研究和初步用户研究两部分进行。在验证研究中，系统在数据集整理过程中与人工评审员进行了比较，能够生成拒绝原因和可操作的改进建议。在涉及三名新手操作员和两种操作任务的初步研究中，接收系统即时、自动后片段反馈的操作员改进速度更快，并且更早地生产出更高质量的示范。这些结果表明，DQAF框架有望显著提升遥操作数据质量，从而推动机器人示范数据的大规模高质量采集。