2026-06-19站内改写1 分钟阅读更新: 2026-06-19

WorkBenchMark：基于乐高的装配基准与面向智能制造联盟的“拆解式装配”基线方法

WorkBenchMark是一个基于乐高得宝的机器人装配基准测试，受RoboCup智能制造联盟启发。它提供400个任务，分为四个复杂度等级，并提出了一个开源词汇感知的‘拆解式装配’基线解决方案。基于规划的流水线在所有等级上均优于现代视觉-语言-动作方法。该基准、仿真环境和基线实现将公开发布。

来源arXiv Robotics作者: Wenbo Ma, Daniel Swoboda, Matteo Tschesche, Till Hofmann

近日，研究团队在arXiv上发表了WorkBenchMark，一个基于乐高得宝积木的机器人装配基准测试，旨在推动RoboCup智能制造联盟的发展。机器人装配任务需要将底层操作与高层符号推理相结合，同时受物理约束影响，这对当前端到端学习方法构成了挑战。WorkBenchMark提供了400个不同复杂度的装配任务，分为四个等级，以全面评估机器人的装配能力。每个等级的任务难度逐渐增加，涵盖了从简单堆叠到复杂结构组装的多种场景。该基准的设计考虑了现实制造中的典型需求，例如零件的识别、抓取、定位和组合，以及处理不确定性。为解决这一难题，研究团队提出了一个开放词汇感知的‘拆解式装配’基线解决方案。该方案通过规划驱动的流水线，将复杂的装配任务分解为可管理的拆解步骤，从而降低了任务难度。具体来说，它利用开放词汇的视觉语言模型来识别零件和装配关系，然后通过符号规划器生成一系列拆解动作，再逆向应用于装配。实验结果表明，该规划基线在所有复杂度等级上均优于现代的视觉-语言-动作（VLA）方法，展示了基于符号推理的规划方法在装配任务中的优势。例如，在最高复杂度等级上，规划基线的成功率比VLA方法高出约30%。WorkBenchMark不仅提供了丰富的任务集和基线方法，还将公开其基准测试、仿真环境以及基线实现代码，以促进机器人装配社区的进一步研究。该论文已被RoboCup Symposium 2026接收，标志着智能制造与机器人操作的交叉领域迈出了重要一步。未来，团队计划扩展基准到更多样化的零件类型和任务模式，并探索如何将学习与规划更紧密地结合。