WorkBenchMark:基於樂高的裝配基準與面向智能製造聯盟的“拆解式裝配”基線方法
WorkBenchMark是一個基於樂高得寶的機器人裝配基準測試,受RoboCup智能製造聯盟啓發。它提供400個任務,分為四個複雜度等級,並提出了一個開源詞彙感知的‘拆解式裝配’基線解決方案。基於規劃的流水線在所有等級上均優於現代視覺-語言-動作方法。該基準、仿真環境和基線實現將公開發布。
近日,研究團隊在arXiv上發表了WorkBenchMark,一個基於樂高得寶積木的機器人裝配基準測試,旨在推動RoboCup智能製造聯盟的發展。機器人裝配任務需要將底層操作與高層符號推理相結合,同時受物理約束影響,這對當前端到端學習方法構成了挑戰。WorkBenchMark提供了400個不同複雜度的裝配任務,分為四個等級,以全面評估機器人的裝配能力。每個等級的任務難度逐漸增加,涵蓋了從簡單堆疊到複雜結構組裝的多種場景。該基準的設計考慮了現實製造中的典型需求,例如零件的識別、抓取、定位和組合,以及處理不確定性。為解決這一難題,研究團隊提出了一個開放詞彙感知的‘拆解式裝配’基線解決方案。該方案通過規劃驅動的流水線,將複雜的裝配任務分解為可管理的拆解步驟,從而降低了任務難度。具體來説,它利用開放詞彙的視覺語言模型來識別零件和裝配關係,然後通過符號規劃器生成一系列拆解動作,再逆向應用於裝配。實驗結果表明,該規劃基線在所有複雜度等級上均優於現代的視覺-語言-動作(VLA)方法,展示了基於符號推理的規劃方法在裝配任務中的優勢。例如,在最高複雜度等級上,規劃基線的成功率比VLA方法高出約30%。WorkBenchMark不僅提供了豐富的任務集和基線方法,還將公開其基準測試、仿真環境以及基線實現代碼,以促進機器人裝配社區的進一步研究。該論文已被RoboCup Symposium 2026接收,標誌着智能製造與機器人操作的交叉領域邁出了重要一步。未來,團隊計劃擴展基準到更多樣化的零件類型和任務模式,並探索如何將學習與規劃更緊密地結合。