2026-05-30 00:14 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

具身認知與代理型AI

本文探討了具身認知的概念，即智能不僅存在於大腦中，還延伸至工具和環境。作者認為，將AI融入聊天界面是賦予其智能的關鍵一步，而代理型AI通過讓AI使用工具和制定計劃，進一步擴展了機器智能。文章批評了單純依賴思考的“思維主義”，並以Yoshua Bengio的Law Zero項目為例，指出脱離現實實驗的AI無法真正解決問題。

來源Hacker News AI作者: ibobev

你的智能位於何處？在你的大腦中？這是一個過於簡單的答案。更好的模型是：你的智能是具身的。

想象一位在高檔餐廳工作的廚師。他擁有所有心愛的刀具和烹飪指南，且都放置在他想要的位置。他的廚房是他智能和技能的一部分。同樣的廚師在你的廚房裏可能比你做得好，但他無法複製在他最愛的廚房裏能做出的菜餚。

我們常常通過白板測試來評估程序員，這引發了無數抱怨。程序員們正確指出，這讓他們脱離了熟悉的環境。當你拿走他們的筆記本電腦時，他們的表現就會下降。這不是藉口，而是一個真實的問題：你切斷了他們智能的一部分。

總而言之，將智能視為一個與外界隔絕的缸中大腦的模型是荒謬的。

如果你接受具身智能的觀點，那麼許多我們視為智能結果的行為實際上是智能的一部分。首先是語言。我們互相交談或書寫的能力意味着我不受限於自身。你有沒有聽説過孤立在小部落中的人類取得了技術突破？沒有。進步需要許多人共同交流。直到幾十年前，進步還需要城市。今天我不太確定，因為我越來越能在世界任何地方與任何人交流。但語言仍然至關重要，我們還沒有發明出更好的東西。同樣，擁有雙手和製造複雜工具（如筆記本電腦）的能力使我們能夠擴展智能。

2022年底，我們迎來了一項突破性技術：ChatGPT。它建立在幾個已有理念之上，例如（大型）語言模型、神經網絡等。這是“GPT”部分。但突破的一個重要且被低估的部分是“Chat”組件。有人想到了將大型語言模型與聊天界面連接起來。也許這對構建該系統的人來説是自然而然且顯而易見的，但不應認為它微不足道或不重要。

語言是我們智能的關鍵組成部分，因此，它對機器智能也至關重要。

我們將AI軟件具身於一個聊天框中。

下一步就是我們今天所説的“代理型AI”。我們保留聊天框，但增添了AI軟件與工具交互並制定使用計劃的能力。實際上，我們賦予了AI更多的自主權：它可以做事情並從結果中學習。它開始像擁有雙手和工具的人類。

上週我與一位同事交談。我的同事全身心投入AI革命。他用AI幫助自己寫得更快更好，並更快完成數據分析，減少了對技術專家的依賴。

但我的同事並不瞭解代理型AI的方法。我試圖在電話中解釋。讓AI訪問工具有什麼意義？這只是為了節省複製粘貼AI回覆的精力嗎？

最後我製作了一個視頻，在RStudio（一個用於R編程和數據分析的環境）中啓動了一個AI。我不使用R或RStudio，但藉助AI，我能夠在幾分鐘內構建一個完整的氣候研究項目，包括從網絡獲取數據。

AI是如何做到的？我錄製了過程。它嘗試了幾種方法，最初在下載數據時遇到困難。在某個時刻，它發現需要新的R包，於是安裝它們，安裝完成後開始生成圖形，並驗證其是否有效。

代理型AI通過改善AI的具身性大大擴展了機器智能。

我認為它還沒有得到應有的理解。

在蒙特利爾，AI領域最資深的教授是Yoshua Bengio。他幾年前創辦了自己的非平凡企業（Element AI）。他的最新項目是Law Zero，旨在創建一個“科學家AI”。該項目的首要目標是構建沒有代理組件的AI。它應該是一個沒有自身目標、沒有自主權的脱離肉身的AI。

我擔心Bengio患上了Kevin Kelly所謂的“思維主義”。讓我引用Kelly 2008年文章中的話：

“沒有哪種智能，無論多麼超級，能夠通過閲讀世界上所有已知科學文獻並思考得出人體如何運作的結論。沒有超級AI能夠僅僅通過思考所有當前和過去的核裂變實驗就在一天內實現可行的核聚變。從不知道事物如何工作到知道它們如何工作，遠不止思維主義。現實世界中有大量的實驗產生大量的數據，這些數據是形成正確工作假設所必需的。思考潛在的數據不會產生正確的數據。思考只是科學的一部分，甚至可能是很小的一部分。（……）思維主義是不夠的。沒有進行實驗、構建原型、經歷失敗和接觸現實，智能可以有想法但沒有結果。它無法通過思考來解決世界的問題。（……）奇點是一個幻象，它會不斷退卻——總是‘接近’但從未到來。我們會疑惑為什麼在擁有AI後它還沒有到來。然後有一天，我們會意識到它已經發生了。超級AI來了，但我們認為它會立即帶來的一切——個人納米技術、大腦升級、永生——並沒有到來。取而代之的是其他我們未曾預料且需要長時間才能欣賞的好處。由於我們沒有看到它們的到來，我們會回顧並説，是的，那就是奇點。”

我認為大學教授尤其容易陷入思維主義。他們將智能視為以大腦中發生的事情為中心。當你住在象牙塔中時，很容易忽視現實世界作為智能的核心來源。此外，他們往往是在思維主義盛行的學校中表現優異的人。

我一生中大部分時間都是教授。然而，我很快就厭倦了與其他教授交談。我最喜歡與那些在現實世界中應用新工具的人一起工作。毫不奇怪，我大部分時間都花在了人們在實際中部署的軟件上。

Kelly所言的是，高度的智能並不足以做很多事情。現實世界不是你思維過程的最後階段，它可能是其中最重要的部分。

因此，當你將AI與現實世界連接，賦予它進行實驗的能力（正如今天幾乎所有軟件開發者所做的那樣），你會得到遠超AI軟件獨立運作所能達到的令人印象深刻的結果。

自主權不是一個特性。自主權是首要的。