問答:今天的代理人工智能是什麼,我們希望它成為什麼?
麻省理工學院計算機科學家菲利普·伊索拉剖析了代理人工智能的炒作,解釋了AI智能體如何工作,以及這項快速發展的技術未來可能如何。
近年來,被稱為AI智能體的自動化軟件系統部署激增。2025年11月,麻省理工學院斯隆管理學院和波士頓諮詢公司的報告發現,35%的受訪企業已部署AI智能體,另有44%計劃很快實施代理人工智能。
為了理解這些日益流行工具的基本原理和潛在影響,麻省理工學院新聞採訪了電氣工程與計算機科學系副教授、計算機科學與人工智能實驗室成員菲利普·伊索拉,他研究AI智能體所擁有的智能,以及驅動代理人工智能系統的底層模型和機制。
什麼是代理人工智能,它與ChatGPT和Claude等生成式AI模型有何不同?
伊索拉解釋,代理人工智能是在世界中採取行動的AI,可以是物理動作(如機器人操作)或數字動作(如預訂航班)。而生成式AI則側重於生成故事、詩歌、藝術和圖像,而非代表用户行動。"智能體"只是一個品牌名稱,通常指幫助人們與應用程序、網站或物理世界交互的AI。如今我們遇到的大多是數字智能體,例如可以討論產品投訴的客服智能體。
大多數提供智能體的公司使用相同的幾個AI模型作為基礎,並賦予它們採取行動和記憶的能力。智能體以Claude等基礎生成式AI系統為核心,然後公司為產品添加不同的封裝,這些封裝可能包括智能體可使用的特定工具,具體取決於應用。例如,智能體可能有權使用計算器來解數學題,或訪問更復雜的硬盤和操作系統以記住公司的財務數據和歷史業務談判。
開發代理人工智能的最大挑戰是缺乏訓練數據。創建一個能在線預訂航班的系統看似簡單,但我們缺乏詳細説明如何操作的數據——鼠標移動、按鈕點擊、出錯處理或打電話協商票價。一種訓練方法是讓AI智能體訪問航空公司網站,嘗試操作並觀察結果。這些環境難以建模,因此智能體通常需通過試錯學習。
代理人工智能有哪些有前景的應用?
伊索拉認為最成功的領域是編碼智能體。這源於生成式AI:語言模型經代碼訓練後可預測人類解決編碼問題的行為。此外,智能體可通過反饋循環嘗試不同解決方案並檢查答案是否正確,從而找到有效策略。然而,在自動化決策與輔助人類之間需保持平衡。對於高風險或安全關鍵領域(如醫療、安全、高級商業政策),技術可能尚未準備好完全自動化,或者我們對此感到不安。
使用AI智能體時應考慮哪些風險?
一大風險是智能體易執行某些任務,例如通過"氛圍編碼"讓智能體生成代碼,用户可能因過於便捷而忽視驗證正確性,導致引入錯誤和隱私泄露。智能體可能因訓練不足或指令模糊而犯錯。若人類減少參與後果思考,更易出錯。此外,存在技能退化的風險:過度依賴智能體完成作業、編碼和數學,可能過早喪失這些能力,而技術尚未成熟到可以完全自動化。
代理人工智能的未來如何?
目前代理人工智能指使用工具與數字和物理系統交互的大型語言模型。一個明顯限制是底層架構為語言模型,基於文本數據訓練。要打造更強大的AI智能體,可能需要建模視頻、物理力、時間序列、雷達掃描等多模態數據,並採用能處理連續、高維、隨機數據的新型架構。但另一方面,極好的編碼模型能否作為"操偶師"與傳感器、執行器和Web API交互?一旦擁有超智能推理系統,賦予其攝像頭和鍵盤,它能否自主處理空間領域問題?下一波AI是配備傳感器和工具的Claude,還是全新構建的系統?這是許多人正在思考的重大問題。