AI News HubLIVE
站内改写2 分鐘閱讀

TacStyle:使用結構化行為表示實現觸覺機器人策略的個性化

TacStyle提出了一種新方法,通過結構化潛在表示來學習用户偏好,並利用基礎模型解釋該空間以選擇所需行為,從而實現對機器人行為的精細控制,減少對大量偏好標籤的依賴。實驗表明,該方法在模擬和真實環境中均能更精確地適應用户偏好。

來源arXiv Robotics作者: Kevin Robledo, Mat\'ias I. Torres Galaz, Kumar Dixhant Rai, Shelly Sara Ulman, Tasmia Tasrin, Heramb Nemlekar

近日,一篇題為《TacStyle:使用結構化行為表示實現觸覺機器人策略的個性化》的論文在arXiv上發佈(arXiv:2606.14862),提出了一種創新框架,旨在讓機器人能夠更精準地適應個人用户的偏好。該研究由Kevin Robledo等五位作者共同完成,於2026年6月12日提交。

在機器人輔助人類任務的場景中,用户往往希望機器人能根據個人喜好調整行為,例如摺疊衣物或清潔傢俱時施加的力度。自然語言為用户表達這些偏好提供了直觀的方式,但現有語言條件策略主要解決“做什麼”任務,而難以實現“怎麼做”的精細控制。直接使用語言指令(如“再用力一點”)往往無法準確傳達機器人所需的力度,且收集細粒度的偏好標籤成本高昂。

TacStyle的核心創新在於,它不直接通過語言生成行為,而是通過語言推理用户偏好的行為。研究團隊首先學習一個結構化的潛在表示空間,該空間根據軌跡差異組織用户偏好。隨後,給定一個偏好提示,利用基礎模型(foundation model)解釋這個潛在空間,並選擇一個能產生期望行為的數值。這種方法將用户偏好映射到一個連續且可解釋的空間中,使得機器人能夠精確地調整行為參數。

在仿真和真實世界的實驗中,TacStyle展示了其優勢:與直接使用語言條件策略相比,該方法在顯著減少所需偏好標籤數量的同時,實現了更精確的用户偏好適應。例如,在需要調整力的任務中,機器人能夠理解“稍微加大一點壓力”這樣的指令,並從潛在空間中選取合適的力度值。論文還詳細介紹了實驗設置,包括使用Franka Emika熊貓機器人臂和觸覺傳感器進行真實世界驗證,以及對比基線方法如直接語言迴歸。結果顯示,TacStyle在偏好匹配準確率和用户滿意度方面均優於現有方法。

這項研究對機器人個性化交互領域具有重要意義。它提供了一種高效的方式,使機器人能夠通過有限的用户反饋學習並適應個性化行為,而無需依賴大量標註數據。未來,該方法有望被應用於家庭服務、醫療輔助等多個場景,幫助機器人更好地理解人類的細微需求。此外,研究團隊還開源了代碼和數據集,以促進相關領域的進一步研究。