2026-06-19站内改写1 分鐘閱讀更新: 2026-06-19

WorkBenchMark：基於樂高的裝配基準與面向智能製造聯盟的“拆解式裝配”基線方法

WorkBenchMark是一個基於樂高得寶的機器人裝配基準測試，受RoboCup智能製造聯盟啓發。它提供400個任務，分為四個複雜度等級，並提出了一個開源詞彙感知的‘拆解式裝配’基線解決方案。基於規劃的流水線在所有等級上均優於現代視覺-語言-動作方法。該基準、仿真環境和基線實現將公開發布。

來源arXiv Robotics作者: Wenbo Ma, Daniel Swoboda, Matteo Tschesche, Till Hofmann

近日，研究團隊在arXiv上發表了WorkBenchMark，一個基於樂高得寶積木的機器人裝配基準測試，旨在推動RoboCup智能製造聯盟的發展。機器人裝配任務需要將底層操作與高層符號推理相結合，同時受物理約束影響，這對當前端到端學習方法構成了挑戰。WorkBenchMark提供了400個不同複雜度的裝配任務，分為四個等級，以全面評估機器人的裝配能力。每個等級的任務難度逐漸增加，涵蓋了從簡單堆疊到複雜結構組裝的多種場景。該基準的設計考慮了現實製造中的典型需求，例如零件的識別、抓取、定位和組合，以及處理不確定性。為解決這一難題，研究團隊提出了一個開放詞彙感知的‘拆解式裝配’基線解決方案。該方案通過規劃驅動的流水線，將複雜的裝配任務分解為可管理的拆解步驟，從而降低了任務難度。具體來説，它利用開放詞彙的視覺語言模型來識別零件和裝配關係，然後通過符號規劃器生成一系列拆解動作，再逆向應用於裝配。實驗結果表明，該規劃基線在所有複雜度等級上均優於現代的視覺-語言-動作（VLA）方法，展示了基於符號推理的規劃方法在裝配任務中的優勢。例如，在最高複雜度等級上，規劃基線的成功率比VLA方法高出約30%。WorkBenchMark不僅提供了豐富的任務集和基線方法，還將公開其基準測試、仿真環境以及基線實現代碼，以促進機器人裝配社區的進一步研究。該論文已被RoboCup Symposium 2026接收，標誌着智能製造與機器人操作的交叉領域邁出了重要一步。未來，團隊計劃擴展基準到更多樣化的零件類型和任務模式，並探索如何將學習與規劃更緊密地結合。