2026-05-30 00:14 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

具身認知與代理型AI

本文探討了具身認知的概念，即智慧不僅存在於大腦中，還延伸至工具和環境。作者認為，將AI融入聊天介面是賦予其智慧的關鍵一步，而代理型AI透過讓AI使用工具和制定計劃，進一步擴充套件了機器智慧。文章批評了單純依賴思考的“思維主義”，並以Yoshua Bengio的Law Zero專案為例，指出脫離現實實驗的AI無法真正解決問題。

來源Hacker News AI作者: ibobev

你的智慧位於何處？在你的大腦中？這是一個過於簡單的答案。更好的模型是：你的智慧是具身的。

想象一位在高檔餐廳工作的廚師。他擁有所有心愛的刀具和烹飪指南，且都放置在他想要的位置。他的廚房是他智慧和技能的一部分。同樣的廚師在你的廚房裡可能比你做得好，但他無法複製在他最愛的廚房裡能做出的菜餚。

我們常常透過白板測試來評估程式設計師，這引發了無數抱怨。程式設計師們正確指出，這讓他們脫離了熟悉的環境。當你拿走他們的筆記型電腦時，他們的表現就會下降。這不是藉口，而是一個真實的問題：你切斷了他們智慧的一部分。

總而言之，將智慧視為一個與外界隔絕的缸中大腦的模型是荒謬的。

如果你接受具身智慧的觀點，那麼許多我們視為智慧結果的行為實際上是智慧的一部分。首先是語言。我們互相交談或書寫的能力意味著我不受限於自身。你有沒有聽說過孤立在小部落中的人類取得了技術突破？沒有。進步需要許多人共同交流。直到幾十年前，進步還需要城市。今天我不太確定，因為我越來越能在世界任何地方與任何人交流。但語言仍然至關重要，我們還沒有發明出更好的東西。同樣，擁有雙手和製造複雜工具（如筆記型電腦）的能力使我們能夠擴充套件智慧。

2022年底，我們迎來了一項突破性技術：ChatGPT。它建立在幾個已有理念之上，例如（大型）語言模型、神經網路等。這是“GPT”部分。但突破的一個重要且被低估的部分是“Chat”元件。有人想到了將大型語言模型與聊天介面連線起來。也許這對構建該系統的人來說是自然而然且顯而易見的，但不應認為它微不足道或不重要。

語言是我們智慧的關鍵組成部分，因此，它對機器智慧也至關重要。

我們將AI軟體具身於一個聊天框中。

下一步就是我們今天所說的“代理型AI”。我們保留聊天框，但增添了AI軟體與工具互動並制定使用計劃的能力。實際上，我們賦予了AI更多的自主權：它可以做事情並從結果中學習。它開始像擁有雙手和工具的人類。

上週我與一位同事交談。我的同事全身心投入AI革命。他用AI幫助自己寫得更快更好，並更快完成資料分析，減少了對技術專家的依賴。

但我的同事並不瞭解代理型AI的方法。我試圖在電話中解釋。讓AI訪問工具有什麼意義？這只是為了節省複製貼上AI回覆的精力嗎？

最後我製作了一個影片，在RStudio（一個用於R程式設計和資料分析的環境）中啟動了一個AI。我不使用R或RStudio，但藉助AI，我能夠在幾分鐘內構建一個完整的氣候研究專案，包括從網路獲取資料。

AI是如何做到的？我錄製了過程。它嘗試了幾種方法，最初在下載資料時遇到困難。在某個時刻，它發現需要新的R包，於是安裝它們，安裝完成後開始生成圖形，並驗證其是否有效。

代理型AI透過改善AI的具身性大大擴充套件了機器智慧。

我認為它還沒有得到應有的理解。

在蒙特利爾，AI領域最資深的教授是Yoshua Bengio。他幾年前創辦了自己的非平凡企業（Element AI）。他的最新專案是Law Zero，旨在建立一個“科學家AI”。該專案的首要目標是構建沒有代理元件的AI。它應該是一個沒有自身目標、沒有自主權的脫離肉身的AI。

我擔心Bengio患上了Kevin Kelly所謂的“思維主義”。讓我引用Kelly 2008年文章中的話：

“沒有哪種智慧，無論多麼超級，能夠透過閱讀世界上所有已知科學文獻並思考得出人體如何運作的結論。沒有超級AI能夠僅僅透過思考所有當前和過去的核裂變實驗就在一天內實現可行的核聚變。從不知道事物如何工作到知道它們如何工作，遠不止思維主義。現實世界中有大量的實驗產生大量的資料，這些資料是形成正確工作假設所必需的。思考潛在的資料不會產生正確的資料。思考只是科學的一部分，甚至可能是很小的一部分。（……）思維主義是不夠的。沒有進行實驗、構建原型、經歷失敗和接觸現實，智慧可以有想法但沒有結果。它無法透過思考來解決世界的問題。（……）奇點是一個幻象，它會不斷退卻——總是‘接近’但從未到來。我們會疑惑為什麼在擁有AI後它還沒有到來。然後有一天，我們會意識到它已經發生了。超級AI來了，但我們認為它會立即帶來的一切——個人奈米技術、大腦升級、永生——並沒有到來。取而代之的是其他我們未曾預料且需要長時間才能欣賞的好處。由於我們沒有看到它們的到來，我們會回顧並說，是的，那就是奇點。”

我認為大學教授尤其容易陷入思維主義。他們將智慧視為以大腦中發生的事情為中心。當你住在象牙塔中時，很容易忽視現實世界作為智慧的核心來源。此外，他們往往是在思維主義盛行的學校中表現優異的人。

我一生中大部分時間都是教授。然而，我很快就厭倦了與其他教授交談。我最喜歡與那些在現實世界中應用新工具的人一起工作。毫不奇怪，我大部分時間都花在了人們在實際中部署的軟體上。

Kelly所言的是，高度的智慧並不足以做很多事情。現實世界不是你思維過程的最後階段，它可能是其中最重要的部分。

因此，當你將AI與現實世界連線，賦予它進行實驗的能力（正如今天幾乎所有軟體開發者所做的那樣），你會得到遠超AI軟體獨立運作所能達到的令人印象深刻的結果。

自主權不是一個特性。自主權是首要的。