AI News HubLIVE
站内改写2 分鐘閱讀

從Hugging Face Hub到機器人硬體:Strands Agents與LeRobot的整合

AWS開源SDK Strands Robots整合了LeRobot,允許開發者透過單一Agent工作流從Hub資料集訓練並在模擬或實體機器人上部署策略。本文介紹了五步流程,並提供了可在筆記本上執行的示例。

AWS開源的Strands Robots SDK(Apache 2.0)現已與LeRobot深度整合,為機器人開發者提供了一條從Hugging Face Hub資料集到實體機器人的無縫路徑。透過將LeRobot棧封裝為AgentTools,開發者可以構建單一智慧體,完成記錄演示、訓練策略、模擬測試以及部署到硬體的全部工作——而無需在不同工具間切換。

該整合的核心設計理念是保持介面的輕量化。LeRobot原有的指令碼(如lerobot-record、lerobot-calibrate)繼續負責硬體記錄和校準,而Strands AgentTools則負責智慧體實際編排的部分。模擬工具記錄的資料集與LeRobot在硬體上寫入的格式完全相同,GR00T和LerobotLocal提供統一的策略推理介面,MolmoAct2檢查點則透過LerobotLocal路徑執行。透過Zenoh對等網格,智慧體還可以協調遠端機器人叢集。

開發者透過一個簡單的Python指令碼即可體驗整套流程。預設模式下,Robot("so100")返回模擬環境,無需連線硬體;設定mode="real"則切換到由LeRobot驅動的實體機器人。Agent程式碼在兩種模式下完全一致。示例應用(位於hub_to_hardware.py和notebook中)可在筆記本上完整執行,從記錄演示、推送到Hub,到在模擬中執行策略,一氣呵成。

文章詳細介紹了五個步驟:首先構建基於LeRobot AgentTools的智慧體;其次在模擬中記錄演示資料集並推送到Hub;然後使用同一資料集在模擬中執行策略;接著透過更改一個引數將相同Agent程式碼部署到物理SO-101機器人;最後利用Zenoh網格向整個機器人群傳送命令。整個過程無需額外硬體或GPU,甚至無需Hugging Face憑證即可完成預設路徑的測試。

對於希望深入實踐的開發者,文章還提供了硬體部署和真實策略(如GR00T或MolmoAct2)的配置指南。值得注意的是,模擬記錄的LeRobotDataset與硬體記錄的資料集格式完全一致,因此訓練指令碼無需修改即可直接使用。NVIDIA最新的Cosmos 3也作為策略提供者支援同一介面。

當前方案仍處於持續演進階段,未來計劃包括改進策略載入流水線、提供演示資料的自動驗證功能,以及支援更多機器人型號。開發者可以從GitHub倉庫克隆示例應用,立即開始構建自己的機器人控制智慧體。