PACT:人机协作中主动询问的持续任务辅助
在长期人机协作中,机器人需要在部分观测下辅助用户,并利用跨天交互历史。然而,协作初期人类特征和惯例未知,被动推断后行动效率低下。为此,本文提出PACT(主动询问持续任务辅助)框架,通过当前观测和累积交互历史评估上下文充分性,决定是否先澄清再行动。实验表明,PACT在辅助准确性和澄清效用上均优于被动基线。
文章情报
要点
- 提出PACT框架,使机器人能在必要时主动询问用户以获取澄清,提高辅助可靠性。
- 使用强化学习实现主要实例,并引入澄清效用指标平衡准确性和询问频率。
- 在多日协作场景中,PACT持续优于被动推断方法。
为什么重要
这条新闻值得关注,因为提出PACT框架,使机器人能在必要时主动询问用户以获取澄清,提高辅助可靠性。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
在长期人机协作中,机器人需要在不完全观测的条件下辅助用户,同时利用跨天的交互历史。然而,在协作初期,人类的习惯和常规通常是未知的,这使得被动的“先推断后行动”方式效率低下且不可靠。针对这一挑战,来自多家研究机构的团队提出了一种名为PACT(Proactive Asking for Continual Task Assistance,主动询问持续任务辅助)的框架。PACT采用“询问或行动”的决策机制,根据当前观测和累积的交互历史来评估上下文是否充分,从而决定在采取行动前是否需要寻求用户的澄清。这一方法使机器人能够提供更可靠的辅助,并随时间逐步适应用户。研究者使用强化学习实现了其主要的学习实例,并在同一框架下评估了其他变体。为了评估行为,他们还引入了一种澄清效用指标,该指标量化了辅助准确性与澄清请求频率之间的权衡,使得系统能够在不同场景下找到合适的平衡点。在多日具身协作场景的实验中,与被动推断基线相比,PACT始终提高了辅助准确性和澄清效用,突显了在持续人机协作中主动询问的重要性。该框架的提出为长期人机协作中的不确定性处理提供了一种新的思路,有望在服务机器人、家庭助手、工业协作等领域得到应用。未来的工作可以探索更高效的决策策略,以及将PACT扩展到多用户或环境动态变化的场景中。