2026-05-27 12:40 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI代理馬具：將LLM轉變為數字工人的粘合劑

AI模型在原始智能方面似乎已達到平台期，下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念，包括工具、記憶和人類參與，並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。

來源Hacker News AI作者: UtkarshPatel13

AI工程3分鐘閲讀

AI模型在原始智能方面似乎已達到平台期。我們不再僅僅通過擴大模型規模就看到推理能力的巨大飛躍。這讓人們感到AI未能達到預期。為了從LLM中獲得更多價值，討論正悄然轉向一種設置，即用“粘合劑”將這些分散的語言模型整合成有用的數字助手。這也被稱為AI代理馬具。

什麼是代理馬具

如果你把模型看作大腦，AI馬具就是其他一切：手（工具）和記憶，幫助進行網絡搜索、使用代碼編輯器、記住過去的行動以及修復錯誤。在需要時引入人類。沒有它，你基本只是在和機器人聊天。有了AI代理馬具，你可以更深入地研究某個主題、調試代碼等。

Google最近在Google I/O 2026上推出了自己的版本，作為Gemini API中的Managed Agents，你可以在安全的雲沙盒中運行Antigravity代理，用自己的指令、技能和數據構建自定義代理，並使用AGENTS.md和SKILL.md將它們定義為可版本化的文件。

LangChain是另一個將行動映射為步驟的平台。還有CrewAI和AutoGen等其他參與者提供不同風格。OpenAI發佈了其Agents SDK（從Swarm演化而來），提供輕量級編排、護欄、追蹤和多代理交接，與其模型配合良好。Anthropic通過其Claude Agent SDK和Computer Use工具提供了強大的代理能力，讓Claude通過截圖、鼠標和鍵盤直接與桌面交互，完成現實世界任務。

這種新範式並非完美無缺。當你有多個代理和長時間運行的任務時，成本可能快速攀升。它們仍可能犯錯，有時需要人類輸入。不過，這些正在隨着時間的推移變得更加穩健。

為何重要

AI代理馬具將成為AI巨頭下一個競爭領域。這需要構建具有彈性和可靠性的基礎設施。在個人層面，掌握馬具技能將非常有用，因為它可以直接轉化為通過下一階段的自動化為企業節省大量資金。