開源軟體開始幫助機器人思考
開源運動正將AI的突破性進展引入機器人領域,降低開發門檻。從ROS框架到輝達、Hugging Face和阿里巴巴的開源模型,機器人推理、決策和行動的能力正變得對更多人可用。但商業激勵與學術初心之間的張力也帶來新挑戰。
文章情報
要點
- 開源機器人軟體歷經數十年發展,ROS框架奠定了基礎設施,如今AI模型的開源正推動機器人“大腦”的進化。
- 輝達、Hugging Face和阿里巴巴等公司推出開源機器人AI工具和模型,大幅降低進入門檻。
- Hugging Face的LeRobot平臺上的機器人資料集從2024年底的1,145個增長到超過58,000個,成為最大數據集類別。
- 商業動機可能使開源偏離純粹學術路徑,但更多參與者的湧入仍加速了領域進步。
為什麼重要
這條新聞值得關注,因為開源機器人軟體歷經數十年發展,ROS框架奠定了基礎設施,如今AI模型的開源正推動機器人“大腦”的進化。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
開源軟體曾讓機器人硬體設計變得更加普及,現在它正將目光投向更困難的挑戰:讓機器人學會思考。過去兩年裡,包括Hugging Face、輝達和阿里巴巴在內的多家公司都在開源機器人領域押下重注,釋出了旨在幫助機器人推理、決策和行動的工具與模型。
這一轉變尚處早期,但勢頭明顯。推動其他AI應用快速發展的開源運動,如今正被用於解決機器人智慧化問題。如果這些將AI帶入機器人、並基於開源平臺的嘗試取得成功,構建一臺實用機器人的門檻可能會像當年構建AI應用那樣迅速降低。
機器人作業系統的前身可以追溯到20世紀90年代中期,但真正改變局面的是2007年問世的機器人作業系統(ROS)。儘管名為作業系統,ROS實際上是一個執行在Linux之上的軟體框架,處理元件間資料移動、硬體通訊、地圖構建、路徑規劃以及資料記錄和視覺化等基礎功能。在ROS出現之前,每個機器人團隊都得自己編寫這些基礎設施,往往要花上一兩年時間才能開始真正的研究。ROS的聯合創始人Brian Gerkey表示,他之所以被這個專案吸引,正是因為開源已經深刻改變了世界——幾乎所有網際網路都建立在開源之上。
如今,開源AI的進步正在湧入機器人領域。輝達機器人產品總監Spencer Huang指出,計算機視覺這個曾經的難題在短短幾年內取得了巨大進步,過去需要大量專業知識才能完成的任務,現在只需幾行程式碼。模擬工具也足夠精確,可用於訓練,而過去需要專門實驗室才能使用的工具現在大多可以免費獲得。Hugging Face於2024年5月推出了LeRobot社群平臺,專門面向機器人AI。自發布以來,平臺上機器人資料集的數量從2024年底的1,145個激增至如今的超過58,000個,成為該中心最大的資料集類別。Hugging Face還透過收購機器人公司Pollen Robotics進軍硬體領域,其CEO Clement Delangue表示,收購源於一個認識:僅靠軟體是不夠的。
然而,商業激勵正在使這片領域變得複雜。早期的ROS主要由學術機構貢獻,沒有商業利益驅動。而現在最大的貢獻者是那些有明確商業動機的公司——它們希望更多人基於自己的平臺進行開發。俄勒岡州立大學教授Bill Smart認為,這未必是壞事,但需要警惕其中的激勵扭曲。他也擔心,進入門檻降低可能導致來自AI領域的研究人員重複解決機器人領域已有的問題。但Smart也承認,無論背後的動機如何,結果是真實的:越來越多的人進入這個領域,工具變得更容易使用,社群比ROS誕生之初時更大、更多元。
Delangue認為,這不僅僅關乎便利。如果只有少數專有系統控制著人們家中的機器人,那將令人擔憂。“開源提供了一條替代路徑,”他說。