2026-06-16站内改写2 分鐘閱讀更新: 2026-06-16

TacStyle：使用結構化行為表示實現觸覺機器人策略的個性化

TacStyle提出了一種新方法，通過結構化潛在表示來學習用户偏好，並利用基礎模型解釋該空間以選擇所需行為，從而實現對機器人行為的精細控制，減少對大量偏好標籤的依賴。實驗表明，該方法在模擬和真實環境中均能更精確地適應用户偏好。

來源arXiv Robotics作者: Kevin Robledo, Mat\'ias I. Torres Galaz, Kumar Dixhant Rai, Shelly Sara Ulman, Tasmia Tasrin, Heramb Nemlekar

近日，一篇題為《TacStyle：使用結構化行為表示實現觸覺機器人策略的個性化》的論文在arXiv上發佈（arXiv:2606.14862），提出了一種創新框架，旨在讓機器人能夠更精準地適應個人用户的偏好。該研究由Kevin Robledo等五位作者共同完成，於2026年6月12日提交。

在機器人輔助人類任務的場景中，用户往往希望機器人能根據個人喜好調整行為，例如摺疊衣物或清潔傢俱時施加的力度。自然語言為用户表達這些偏好提供了直觀的方式，但現有語言條件策略主要解決“做什麼”任務，而難以實現“怎麼做”的精細控制。直接使用語言指令（如“再用力一點”）往往無法準確傳達機器人所需的力度，且收集細粒度的偏好標籤成本高昂。

TacStyle的核心創新在於，它不直接通過語言生成行為，而是通過語言推理用户偏好的行為。研究團隊首先學習一個結構化的潛在表示空間，該空間根據軌跡差異組織用户偏好。隨後，給定一個偏好提示，利用基礎模型（foundation model）解釋這個潛在空間，並選擇一個能產生期望行為的數值。這種方法將用户偏好映射到一個連續且可解釋的空間中，使得機器人能夠精確地調整行為參數。

在仿真和真實世界的實驗中，TacStyle展示了其優勢：與直接使用語言條件策略相比，該方法在顯著減少所需偏好標籤數量的同時，實現了更精確的用户偏好適應。例如，在需要調整力的任務中，機器人能夠理解“稍微加大一點壓力”這樣的指令，並從潛在空間中選取合適的力度值。論文還詳細介紹了實驗設置，包括使用Franka Emika熊貓機器人臂和觸覺傳感器進行真實世界驗證，以及對比基線方法如直接語言迴歸。結果顯示，TacStyle在偏好匹配準確率和用户滿意度方面均優於現有方法。

這項研究對機器人個性化交互領域具有重要意義。它提供了一種高效的方式，使機器人能夠通過有限的用户反饋學習並適應個性化行為，而無需依賴大量標註數據。未來，該方法有望被應用於家庭服務、醫療輔助等多個場景，幫助機器人更好地理解人類的細微需求。此外，研究團隊還開源了代碼和數據集，以促進相關領域的進一步研究。