開源軟件開始幫助機器人思考
開源運動正將AI的突破性進展引入機器人領域,降低開發門檻。從ROS框架到英偉達、Hugging Face和阿里巴巴的開源模型,機器人推理、決策和行動的能力正變得對更多人可用。但商業激勵與學術初心之間的張力也帶來新挑戰。
文章情報
要點
- 開源機器人軟件歷經數十年發展,ROS框架奠定了基礎設施,如今AI模型的開源正推動機器人“大腦”的進化。
- 英偉達、Hugging Face和阿里巴巴等公司推出開源機器人AI工具和模型,大幅降低進入門檻。
- Hugging Face的LeRobot平台上的機器人數據集從2024年底的1,145個增長到超過58,000個,成為最大數據集類別。
- 商業動機可能使開源偏離純粹學術路徑,但更多參與者的湧入仍加速了領域進步。
為甚麼重要
這條新聞值得關注,因為開源機器人軟件歷經數十年發展,ROS框架奠定了基礎設施,如今AI模型的開源正推動機器人“大腦”的進化。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
開源軟件曾讓機器人硬件設計變得更加普及,現在它正將目光投向更困難的挑戰:讓機器人學會思考。過去兩年裏,包括Hugging Face、英偉達和阿里巴巴在內的多家公司都在開源機器人領域押下重注,發佈了旨在幫助機器人推理、決策和行動的工具與模型。
這一轉變尚處早期,但勢頭明顯。推動其他AI應用快速發展的開源運動,如今正被用於解決機器人智能化問題。如果這些將AI帶入機器人、並基於開源平台的嘗試取得成功,構建一台實用機器人的門檻可能會像當年構建AI應用那樣迅速降低。
機器人操作系統的前身可以追溯到20世紀90年代中期,但真正改變局面的是2007年問世的機器人操作系統(ROS)。儘管名為操作系統,ROS實際上是一個運行在Linux之上的軟件框架,處理組件間數據移動、硬件通信、地圖構建、路徑規劃以及數據記錄和可視化等基礎功能。在ROS出現之前,每個機器人團隊都得自己編寫這些基礎設施,往往要花上一兩年時間才能開始真正的研究。ROS的聯合創始人Brian Gerkey表示,他之所以被這個項目吸引,正是因為開源已經深刻改變了世界——幾乎所有互聯網都建立在開源之上。
如今,開源AI的進步正在湧入機器人領域。英偉達機器人產品總監Spencer Huang指出,計算機視覺這個曾經的難題在短短幾年內取得了巨大進步,過去需要大量專業知識才能完成的任務,現在只需幾行代碼。仿真工具也足夠精確,可用於訓練,而過去需要專門實驗室才能使用的工具現在大多可以免費獲得。Hugging Face於2024年5月推出了LeRobot社區平台,專門面向機器人AI。自發布以來,平台上機器人數據集的數量從2024年底的1,145個激增至如今的超過58,000個,成為該中心最大的數據集類別。Hugging Face還通過收購機器人公司Pollen Robotics進軍硬件領域,其CEO Clement Delangue表示,收購源於一個認識:僅靠軟件是不夠的。
然而,商業激勵正在使這片領域變得複雜。早期的ROS主要由學術機構貢獻,沒有商業利益驅動。而現在最大的貢獻者是那些有明確商業動機的公司——它們希望更多人基於自己的平台進行開發。俄勒岡州立大學教授Bill Smart認為,這未必是壞事,但需要警惕其中的激勵扭曲。他也擔心,進入門檻降低可能導致來自AI領域的研究人員重複解決機器人領域已有的問題。但Smart也承認,無論背後的動機如何,結果是真實的:越來越多的人進入這個領域,工具變得更容易使用,社區比ROS誕生之初時更大、更多元。
Delangue認為,這不僅僅關乎便利。如果只有少數專有系統控制着人們家中的機器人,那將令人擔憂。“開源提供了一條替代路徑,”他説。