AI News HubLIVE
站内改写2 分钟阅读

TacStyle:使用结构化行为表示实现触觉机器人策略的个性化

TacStyle提出了一种新方法,通过结构化潜在表示来学习用户偏好,并利用基础模型解释该空间以选择所需行为,从而实现对机器人行为的精细控制,减少对大量偏好标签的依赖。实验表明,该方法在模拟和真实环境中均能更精确地适应用户偏好。

来源arXiv Robotics作者: Kevin Robledo, Mat\'ias I. Torres Galaz, Kumar Dixhant Rai, Shelly Sara Ulman, Tasmia Tasrin, Heramb Nemlekar

近日,一篇题为《TacStyle:使用结构化行为表示实现触觉机器人策略的个性化》的论文在arXiv上发布(arXiv:2606.14862),提出了一种创新框架,旨在让机器人能够更精准地适应个人用户的偏好。该研究由Kevin Robledo等五位作者共同完成,于2026年6月12日提交。

在机器人辅助人类任务的场景中,用户往往希望机器人能根据个人喜好调整行为,例如折叠衣物或清洁家具时施加的力度。自然语言为用户表达这些偏好提供了直观的方式,但现有语言条件策略主要解决“做什么”任务,而难以实现“怎么做”的精细控制。直接使用语言指令(如“再用力一点”)往往无法准确传达机器人所需的力度,且收集细粒度的偏好标签成本高昂。

TacStyle的核心创新在于,它不直接通过语言生成行为,而是通过语言推理用户偏好的行为。研究团队首先学习一个结构化的潜在表示空间,该空间根据轨迹差异组织用户偏好。随后,给定一个偏好提示,利用基础模型(foundation model)解释这个潜在空间,并选择一个能产生期望行为的数值。这种方法将用户偏好映射到一个连续且可解释的空间中,使得机器人能够精确地调整行为参数。

在仿真和真实世界的实验中,TacStyle展示了其优势:与直接使用语言条件策略相比,该方法在显著减少所需偏好标签数量的同时,实现了更精确的用户偏好适应。例如,在需要调整力的任务中,机器人能够理解“稍微加大一点压力”这样的指令,并从潜在空间中选取合适的力度值。论文还详细介绍了实验设置,包括使用Franka Emika熊猫机器人臂和触觉传感器进行真实世界验证,以及对比基线方法如直接语言回归。结果显示,TacStyle在偏好匹配准确率和用户满意度方面均优于现有方法。

这项研究对机器人个性化交互领域具有重要意义。它提供了一种高效的方式,使机器人能够通过有限的用户反馈学习并适应个性化行为,而无需依赖大量标注数据。未来,该方法有望被应用于家庭服务、医疗辅助等多个场景,帮助机器人更好地理解人类的细微需求。此外,研究团队还开源了代码和数据集,以促进相关领域的进一步研究。