AI News HubLIVE
站内改写

开源软件开始帮助机器人思考

开源运动正将AI的突破性进展引入机器人领域,降低开发门槛。从ROS框架到英伟达、Hugging Face和阿里巴巴的开源模型,机器人推理、决策和行动的能力正变得对更多人可用。但商业激励与学术初心之间的张力也带来新挑战。

文章情报

工程师进阶

要点

  • 开源机器人软件历经数十年发展,ROS框架奠定了基础设施,如今AI模型的开源正推动机器人“大脑”的进化。
  • 英伟达、Hugging Face和阿里巴巴等公司推出开源机器人AI工具和模型,大幅降低进入门槛。
  • Hugging Face的LeRobot平台上的机器人数据集从2024年底的1,145个增长到超过58,000个,成为最大数据集类别。
  • 商业动机可能使开源偏离纯粹学术路径,但更多参与者的涌入仍加速了领域进步。

为什么重要

这条新闻值得关注,因为开源机器人软件历经数十年发展,ROS框架奠定了基础设施,如今AI模型的开源正推动机器人“大脑”的进化。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

开源软件曾让机器人硬件设计变得更加普及,现在它正将目光投向更困难的挑战:让机器人学会思考。过去两年里,包括Hugging Face、英伟达和阿里巴巴在内的多家公司都在开源机器人领域押下重注,发布了旨在帮助机器人推理、决策和行动的工具与模型。

这一转变尚处早期,但势头明显。推动其他AI应用快速发展的开源运动,如今正被用于解决机器人智能化问题。如果这些将AI带入机器人、并基于开源平台的尝试取得成功,构建一台实用机器人的门槛可能会像当年构建AI应用那样迅速降低。

机器人操作系统的前身可以追溯到20世纪90年代中期,但真正改变局面的是2007年问世的机器人操作系统(ROS)。尽管名为操作系统,ROS实际上是一个运行在Linux之上的软件框架,处理组件间数据移动、硬件通信、地图构建、路径规划以及数据记录和可视化等基础功能。在ROS出现之前,每个机器人团队都得自己编写这些基础设施,往往要花上一两年时间才能开始真正的研究。ROS的联合创始人Brian Gerkey表示,他之所以被这个项目吸引,正是因为开源已经深刻改变了世界——几乎所有互联网都建立在开源之上。

如今,开源AI的进步正在涌入机器人领域。英伟达机器人产品总监Spencer Huang指出,计算机视觉这个曾经的难题在短短几年内取得了巨大进步,过去需要大量专业知识才能完成的任务,现在只需几行代码。仿真工具也足够精确,可用于训练,而过去需要专门实验室才能使用的工具现在大多可以免费获得。Hugging Face于2024年5月推出了LeRobot社区平台,专门面向机器人AI。自发布以来,平台上机器人数据集的数量从2024年底的1,145个激增至如今的超过58,000个,成为该中心最大的数据集类别。Hugging Face还通过收购机器人公司Pollen Robotics进军硬件领域,其CEO Clement Delangue表示,收购源于一个认识:仅靠软件是不够的。

然而,商业激励正在使这片领域变得复杂。早期的ROS主要由学术机构贡献,没有商业利益驱动。而现在最大的贡献者是那些有明确商业动机的公司——它们希望更多人基于自己的平台进行开发。俄勒冈州立大学教授Bill Smart认为,这未必是坏事,但需要警惕其中的激励扭曲。他也担心,进入门槛降低可能导致来自AI领域的研究人员重复解决机器人领域已有的问题。但Smart也承认,无论背后的动机如何,结果是真实的:越来越多的人进入这个领域,工具变得更容易使用,社区比ROS诞生之初时更大、更多元。

Delangue认为,这不仅仅关乎便利。如果只有少数专有系统控制着人们家中的机器人,那将令人担忧。“开源提供了一条替代路径,”他说。