AI News HubLIVE
站内改写

AI代理馬具:將LLM轉變為數字工人的粘合劑

AI模型在原始智能方面似乎已達到平台期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。

文章情報

工程師中級

要點

  • AI模型智能提升放緩,代理馬具成為新焦點。
  • 代理馬具為LLM提供工具、記憶和糾錯能力。
  • Google、LangChain、OpenAI、Anthropic等推出各自方案。
  • 成本仍高,但基礎設施正變得更加穩健。

為甚麼重要

這條新聞值得關注,因為AI模型智能提升放緩,代理馬具成為新焦點。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

AI工程3分鐘閲讀

AI代理馬具:將LLM轉變為數字工人的粘合劑

AI模型在原始智能方面似乎已達到平台期。我們不再僅僅通過擴大模型規模就看到推理能力的巨大飛躍。這讓人們感到AI未能達到預期。為了從LLM中獲得更多價值,討論正悄然轉向一種設置,即用“粘合劑”將這些分散的語言模型整合成有用的數字助手。這也被稱為AI代理馬具。

什麼是代理馬具

如果你把模型看作大腦,AI馬具就是其他一切:手(工具)和記憶,幫助進行網絡搜索、使用代碼編輯器、記住過去的行動以及修復錯誤。在需要時引入人類。沒有它,你基本只是在和機器人聊天。有了AI代理馬具,你可以更深入地研究某個主題、調試代碼等。

Google最近在Google I/O 2026上推出了自己的版本,作為Gemini API中的Managed Agents,你可以在安全的雲沙盒中運行Antigravity代理,用自己的指令、技能和數據構建自定義代理,並使用AGENTS.md和SKILL.md將它們定義為可版本化的文件。

LangChain是另一個將行動映射為步驟的平台。還有CrewAI和AutoGen等其他參與者提供不同風格。OpenAI發佈了其Agents SDK(從Swarm演化而來),提供輕量級編排、護欄、追蹤和多代理交接,與其模型配合良好。Anthropic通過其Claude Agent SDK和Computer Use工具提供了強大的代理能力,讓Claude通過截圖、鼠標和鍵盤直接與桌面交互,完成現實世界任務。

這種新範式並非完美無缺。當你有多個代理和長時間運行的任務時,成本可能快速攀升。它們仍可能犯錯,有時需要人類輸入。不過,這些正在隨着時間的推移變得更加穩健。

為何重要

AI代理馬具將成為AI巨頭下一個競爭領域。這需要構建具有彈性和可靠性的基礎設施。在個人層面,掌握馬具技能將非常有用,因為它可以直接轉化為通過下一階段的自動化為企業節省大量資金。