AI News HubLIVE
站内改写

AI代理马具:将LLM转变为数字工人的粘合剂

AI模型在原始智能方面似乎已达到平台期,下一阶段的进步来自于围绕模型构建的“代理马具”。本文介绍了代理马具的概念,包括工具、记忆和人类参与,并比较了Google、LangChain、OpenAI、Anthropic等公司的解决方案。

文章情报

工程师中级

要点

  • AI模型智能提升放缓,代理马具成为新焦点。
  • 代理马具为LLM提供工具、记忆和纠错能力。
  • Google、LangChain、OpenAI、Anthropic等推出各自方案。
  • 成本仍高,但基础设施正变得更加稳健。

为什么重要

这条新闻值得关注,因为AI模型智能提升放缓,代理马具成为新焦点。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

AI工程3分钟阅读

AI代理马具:将LLM转变为数字工人的粘合剂

AI模型在原始智能方面似乎已达到平台期。我们不再仅仅通过扩大模型规模就看到推理能力的巨大飞跃。这让人们感到AI未能达到预期。为了从LLM中获得更多价值,讨论正悄然转向一种设置,即用“粘合剂”将这些分散的语言模型整合成有用的数字助手。这也被称为AI代理马具。

什么是代理马具

如果你把模型看作大脑,AI马具就是其他一切:手(工具)和记忆,帮助进行网络搜索、使用代码编辑器、记住过去的行动以及修复错误。在需要时引入人类。没有它,你基本只是在和机器人聊天。有了AI代理马具,你可以更深入地研究某个主题、调试代码等。

Google最近在Google I/O 2026上推出了自己的版本,作为Gemini API中的Managed Agents,你可以在安全的云沙盒中运行Antigravity代理,用自己的指令、技能和数据构建自定义代理,并使用AGENTS.md和SKILL.md将它们定义为可版本化的文件。

LangChain是另一个将行动映射为步骤的平台。还有CrewAI和AutoGen等其他参与者提供不同风格。OpenAI发布了其Agents SDK(从Swarm演化而来),提供轻量级编排、护栏、追踪和多代理交接,与其模型配合良好。Anthropic通过其Claude Agent SDK和Computer Use工具提供了强大的代理能力,让Claude通过截图、鼠标和键盘直接与桌面交互,完成现实世界任务。

这种新范式并非完美无缺。当你有多个代理和长时间运行的任务时,成本可能快速攀升。它们仍可能犯错,有时需要人类输入。不过,这些正在随着时间的推移变得更加稳健。

为何重要

AI代理马具将成为AI巨头下一个竞争领域。这需要构建具有弹性和可靠性的基础设施。在个人层面,掌握马具技能将非常有用,因为它可以直接转化为通过下一阶段的自动化为企业节省大量资金。