AI News HubLIVE
站内改写2 分钟阅读

从Hugging Face Hub到机器人硬件:Strands Agents与LeRobot的集成

AWS开源SDK Strands Robots集成了LeRobot,允许开发者通过单一Agent工作流从Hub数据集训练并在模拟或实体机器人上部署策略。本文介绍了五步流程,并提供了可在笔记本上运行的示例。

AWS开源的Strands Robots SDK(Apache 2.0)现已与LeRobot深度集成,为机器人开发者提供了一条从Hugging Face Hub数据集到实体机器人的无缝路径。通过将LeRobot栈封装为AgentTools,开发者可以构建单一智能体,完成记录演示、训练策略、模拟测试以及部署到硬件的全部工作——而无需在不同工具间切换。

该集成的核心设计理念是保持接口的轻量化。LeRobot原有的脚本(如lerobot-record、lerobot-calibrate)继续负责硬件记录和校准,而Strands AgentTools则负责智能体实际编排的部分。模拟工具记录的数据集与LeRobot在硬件上写入的格式完全相同,GR00T和LerobotLocal提供统一的策略推理接口,MolmoAct2检查点则通过LerobotLocal路径运行。通过Zenoh对等网格,智能体还可以协调远程机器人集群。

开发者通过一个简单的Python脚本即可体验整套流程。默认模式下,Robot("so100")返回模拟环境,无需连接硬件;设置mode="real"则切换到由LeRobot驱动的实体机器人。Agent代码在两种模式下完全一致。示例应用(位于hub_to_hardware.py和notebook中)可在笔记本上完整运行,从记录演示、推送到Hub,到在模拟中运行策略,一气呵成。

文章详细介绍了五个步骤:首先构建基于LeRobot AgentTools的智能体;其次在模拟中记录演示数据集并推送到Hub;然后使用同一数据集在模拟中运行策略;接着通过更改一个参数将相同Agent代码部署到物理SO-101机器人;最后利用Zenoh网格向整个机器人群发送命令。整个过程无需额外硬件或GPU,甚至无需Hugging Face凭证即可完成默认路径的测试。

对于希望深入实践的开发者,文章还提供了硬件部署和真实策略(如GR00T或MolmoAct2)的配置指南。值得注意的是,模拟记录的LeRobotDataset与硬件记录的数据集格式完全一致,因此训练脚本无需修改即可直接使用。NVIDIA最新的Cosmos 3也作为策略提供者支持同一接口。

当前方案仍处于持续演进阶段,未来计划包括改进策略加载流水线、提供演示数据的自动验证功能,以及支持更多机器人型号。开发者可以从GitHub仓库克隆示例应用,立即开始构建自己的机器人控制智能体。