問答:今天的代理人工智慧是什麼,我們希望它成為什麼?
麻省理工學院電腦科學家菲利普·伊索拉剖析了代理人工智慧的炒作,解釋了AI智慧體如何工作,以及這項快速發展的技術未來可能如何。
近年來,被稱為AI智慧體的自動化軟體系統部署激增。2025年11月,麻省理工學院斯隆管理學院和波士頓諮詢公司的報告發現,35%的受訪企業已部署AI智慧體,另有44%計劃很快實施代理人工智慧。
為了理解這些日益流行工具的基本原理和潛在影響,麻省理工學院新聞採訪了電氣工程與電腦科學系副教授、電腦科學與人工智慧實驗室成員菲利普·伊索拉,他研究AI智慧體所擁有的智慧,以及驅動代理人工智慧系統的底層模型和機制。
什麼是代理人工智慧,它與ChatGPT和Claude等生成式AI模型有何不同?
伊索拉解釋,代理人工智慧是在世界中採取行動的AI,可以是物理動作(如機器人操作)或數字動作(如預訂航班)。而生成式AI則側重於生成故事、詩歌、藝術和影像,而非代表使用者行動。"智慧體"只是一個品牌名稱,通常指幫助人們與應用程式、網站或物理世界互動的AI。如今我們遇到的大多是數字智慧體,例如可以討論產品投訴的客服智慧體。
大多數提供智慧體的公司使用相同的幾個AI模型作為基礎,並賦予它們採取行動和記憶的能力。智慧體以Claude等基礎生成式AI系統為核心,然後公司為產品新增不同的封裝,這些封裝可能包括智慧體可使用的特定工具,具體取決於應用。例如,智慧體可能有權使用計算器來解數學題,或訪問更復雜的硬碟和作業系統以記住公司的財務資料和歷史業務談判。
開發代理人工智慧的最大挑戰是缺乏訓練資料。建立一個能線上預訂航班的系統看似簡單,但我們缺乏詳細說明如何操作的資料——滑鼠移動、按鈕點選、出錯處理或打電話協商票價。一種訓練方法是讓AI智慧體訪問航空公司網站,嘗試操作並觀察結果。這些環境難以建模,因此智慧體通常需透過試錯學習。
代理人工智慧有哪些有前景的應用?
伊索拉認為最成功的領域是編碼智慧體。這源於生成式AI:語言模型經程式碼訓練後可預測人類解決編碼問題的行為。此外,智慧體可透過反饋迴圈嘗試不同解決方案並檢查答案是否正確,從而找到有效策略。然而,在自動化決策與輔助人類之間需保持平衡。對於高風險或安全關鍵領域(如醫療、安全、高階商業政策),技術可能尚未準備好完全自動化,或者我們對此感到不安。
使用AI智慧體時應考慮哪些風險?
一大風險是智慧體易執行某些任務,例如透過"氛圍編碼"讓智慧體生成程式碼,使用者可能因過於便捷而忽視驗證正確性,導致引入錯誤和隱私洩露。智慧體可能因訓練不足或指令模糊而犯錯。若人類減少參與後果思考,更易出錯。此外,存在技能退化的風險:過度依賴智慧體完成作業、編碼和數學,可能過早喪失這些能力,而技術尚未成熟到可以完全自動化。
代理人工智慧的未來如何?
目前代理人工智慧指使用工具與數字和物理系統互動的大型語言模型。一個明顯限制是底層架構為語言模型,基於文本資料訓練。要打造更強大的AI智慧體,可能需要建模影片、物理力、時間序列、雷達掃描等多模態資料,並採用能處理連續、高維、隨機資料的新型架構。但另一方面,極好的編碼模型能否作為"操偶師"與感測器、執行器和Web API互動?一旦擁有超智慧推理系統,賦予其攝像頭和鍵盤,它能否自主處理空間領域問題?下一波AI是配備感測器和工具的Claude,還是全新構建的系統?這是許多人正在思考的重大問題。