WorkBenchMark:基于乐高的装配基准与面向智能制造联盟的“拆解式装配”基线方法
WorkBenchMark是一个基于乐高得宝的机器人装配基准测试,受RoboCup智能制造联盟启发。它提供400个任务,分为四个复杂度等级,并提出了一个开源词汇感知的‘拆解式装配’基线解决方案。基于规划的流水线在所有等级上均优于现代视觉-语言-动作方法。该基准、仿真环境和基线实现将公开发布。
近日,研究团队在arXiv上发表了WorkBenchMark,一个基于乐高得宝积木的机器人装配基准测试,旨在推动RoboCup智能制造联盟的发展。机器人装配任务需要将底层操作与高层符号推理相结合,同时受物理约束影响,这对当前端到端学习方法构成了挑战。WorkBenchMark提供了400个不同复杂度的装配任务,分为四个等级,以全面评估机器人的装配能力。每个等级的任务难度逐渐增加,涵盖了从简单堆叠到复杂结构组装的多种场景。该基准的设计考虑了现实制造中的典型需求,例如零件的识别、抓取、定位和组合,以及处理不确定性。为解决这一难题,研究团队提出了一个开放词汇感知的‘拆解式装配’基线解决方案。该方案通过规划驱动的流水线,将复杂的装配任务分解为可管理的拆解步骤,从而降低了任务难度。具体来说,它利用开放词汇的视觉语言模型来识别零件和装配关系,然后通过符号规划器生成一系列拆解动作,再逆向应用于装配。实验结果表明,该规划基线在所有复杂度等级上均优于现代的视觉-语言-动作(VLA)方法,展示了基于符号推理的规划方法在装配任务中的优势。例如,在最高复杂度等级上,规划基线的成功率比VLA方法高出约30%。WorkBenchMark不仅提供了丰富的任务集和基线方法,还将公开其基准测试、仿真环境以及基线实现代码,以促进机器人装配社区的进一步研究。该论文已被RoboCup Symposium 2026接收,标志着智能制造与机器人操作的交叉领域迈出了重要一步。未来,团队计划扩展基准到更多样化的零件类型和任务模式,并探索如何将学习与规划更紧密地结合。