2026-06-16站内改写2 分钟阅读更新: 2026-06-16

TacStyle：使用结构化行为表示实现触觉机器人策略的个性化

TacStyle提出了一种新方法，通过结构化潜在表示来学习用户偏好，并利用基础模型解释该空间以选择所需行为，从而实现对机器人行为的精细控制，减少对大量偏好标签的依赖。实验表明，该方法在模拟和真实环境中均能更精确地适应用户偏好。

来源arXiv Robotics作者: Kevin Robledo, Mat\'ias I. Torres Galaz, Kumar Dixhant Rai, Shelly Sara Ulman, Tasmia Tasrin, Heramb Nemlekar

近日，一篇题为《TacStyle：使用结构化行为表示实现触觉机器人策略的个性化》的论文在arXiv上发布（arXiv:2606.14862），提出了一种创新框架，旨在让机器人能够更精准地适应个人用户的偏好。该研究由Kevin Robledo等五位作者共同完成，于2026年6月12日提交。

在机器人辅助人类任务的场景中，用户往往希望机器人能根据个人喜好调整行为，例如折叠衣物或清洁家具时施加的力度。自然语言为用户表达这些偏好提供了直观的方式，但现有语言条件策略主要解决“做什么”任务，而难以实现“怎么做”的精细控制。直接使用语言指令（如“再用力一点”）往往无法准确传达机器人所需的力度，且收集细粒度的偏好标签成本高昂。

TacStyle的核心创新在于，它不直接通过语言生成行为，而是通过语言推理用户偏好的行为。研究团队首先学习一个结构化的潜在表示空间，该空间根据轨迹差异组织用户偏好。随后，给定一个偏好提示，利用基础模型（foundation model）解释这个潜在空间，并选择一个能产生期望行为的数值。这种方法将用户偏好映射到一个连续且可解释的空间中，使得机器人能够精确地调整行为参数。

在仿真和真实世界的实验中，TacStyle展示了其优势：与直接使用语言条件策略相比，该方法在显著减少所需偏好标签数量的同时，实现了更精确的用户偏好适应。例如，在需要调整力的任务中，机器人能够理解“稍微加大一点压力”这样的指令，并从潜在空间中选取合适的力度值。论文还详细介绍了实验设置，包括使用Franka Emika熊猫机器人臂和触觉传感器进行真实世界验证，以及对比基线方法如直接语言回归。结果显示，TacStyle在偏好匹配准确率和用户满意度方面均优于现有方法。

这项研究对机器人个性化交互领域具有重要意义。它提供了一种高效的方式，使机器人能够通过有限的用户反馈学习并适应个性化行为，而无需依赖大量标注数据。未来，该方法有望被应用于家庭服务、医疗辅助等多个场景，帮助机器人更好地理解人类的细微需求。此外，研究团队还开源了代码和数据集，以促进相关领域的进一步研究。