2026-05-27 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

遙操作中的數據質量閉環：面向高質量示範採集的片段級評估與反饋

遙操作在機器人數據採集中至關重要，但新手操作員常產生雖任務成功但次優的示範。本文提出數據質量評估與反饋（DQAF）框架，通過即時反饋提升示範質量。

來源arXiv Robotics作者: Gokul Narayanan, Yash Shahapurkar, Melih Erdogan, Brian Zhu, Eugen Solowjow

工業自動化正處於關鍵轉折點：物理人工智能正在推動從僵化、手工設計的自動化系統向更靈活、適應性更強的系統轉變。這一轉變催生了對大規模、真實世界機器人示範數據的巨大需求，使得遙操作成為日益重要的數據採集機制。然而，在實際中，高質量的遙操作示範仍然難以獲得。新手操作員常常產生任務成功但下游使用次優的操作片段，原因包括運動效率低下、反覆修正或接近機器人關節極限操作。

為了應對這一挑戰，本文提出了數據質量評估與反饋框架（DQAF），該框架通過提供基於語義任務進度和機器人遙測的即時後片段反饋，在遙操作中實現了閉環。DQAF框架提取與質量相關的多種信號，如子任務進度、運動平滑度、停滯和運動學極限，並將其轉化為結構化的質量評估和可操作的自然語言反饋。與僅告知成功或失敗的二元反饋不同，該系統能夠解釋片段次優的原因，並突出顯示在下一次嘗試中需要糾正的具體行為。

研究人員的評估通過診斷驗證研究和初步用户研究兩部分進行。在驗證研究中，系統在數據集整理過程中與人工評審員進行了比較，能夠生成拒絕原因和可操作的改進建議。在涉及三名新手操作員和兩種操作任務的初步研究中，接收系統即時、自動後片段反饋的操作員改進速度更快，並且更早地生產出更高質量的示範。這些結果表明，DQAF框架有望顯著提升遙操作數據質量，從而推動機器人示範數據的大規模高質量採集。