AI News HubLIVE
站内改写2 分钟阅读

线性思维,非线性成本

编码智能体简化了AI工作流的构建,但掩盖了成本的非线性增长。经典优化技术如记忆化、剪枝和动态规划对于避免重复工作和高额成本至关重要。

来源O'Reilly AI & ML Radar作者: Nicole Koenigstein

许多AI智能体系统在达到技术上令人印象深刻之前,经济上就已变得不可持续。团队通常关注模型选择、提示设计、工具调用和编排,但这些只是系统设置的一部分。更深层的问题是,像Claude Code、Codex和Jules这样的编码智能体使得智能体工作流更易于生成,但当实现被抽象化后,底层机制就变得难以看清。过去糟糕的工程导致代码运行缓慢,现在则产生既昂贵又缓慢的系统。

在设计智能体系统时,必须记住成本是非线性扩展的。单个用户请求很少只触发一次模型调用,而是扩展为路由、检索、推理、反思、护栏检查、工具调用和合成。每一步都可能重复共享上下文、重新加载状态、重新计算规划器决策或重试失败的路径。一个看似智能的工作流实际上可能表现为递归的、有状态的计算,包含重叠的子问题。这听起来像回溯、动态规划和记忆化,没错,正是如此。

优化此类系统的方法已存在,但编码智能体使系统更易生成而非更易优化。除非认识到底层机制,否则可能永远不会要求智能体应用那些能保持系统可行性的优化模式。

当使用编码智能体生成架构时,很容易止步于“追踪看起来合理”。工具可以生成路由器、检索器、规划器等,它也可能知道缓存、剪枝、记忆化和状态建模,但除非明确要求优化层,否则不会自动实现。即使有智能体指令,若项目文件未包含对重复上下文、记忆化、缓存失效、剪枝和每次请求成本的约束,生成的系统可能在功能上正确,但经济上浪费。代码可通过审查,单元测试可通过,架构看起来合理,而账单才是隐藏计算最终显现的地方。

成本乘数首先表现为延迟。用户看不到路由、重试、反思循环,只觉得智能体太慢。在传统应用中,失败操作会抛出错误或超时;在智能体工作流中,失败可能看起来像是为提高可靠性所做的努力。例如,若某步骤成功率为60%,通过重试逼近99%需5次重试:1 - (1 - 0.60)^5 ≈ 0.99。但这假设每次重试是独立试验,而LLM并非如此。模型从相同分布中抽取,改变温度无法修复底层状态。重响应提供结构化反馈,说明前次尝试为何失败,并改变提示、工具选择等有意义的内容。

记忆化将重复计算转为查找,适用于规划器对相同状态做决策时。剪枝处理不应进一步探索的分支,当工具反复返回无新信息或反思循环无改进时,应停止。动态规划适用于不同分支解决重叠子问题,如研究智能体在多个文档中询问类似问题。这些模式——记忆化减少重复决策,剪枝减少重复失败,动态规划减少重复子问题求解——构成了许多生产环境智能体架构缺失的优化层。

优化需遵循拓扑:集中式编排器应优先对规划器记忆化;去中心化应缓存共享上下文并剪枝冗余交换;独立/群体中,记忆化和剪枝是承载负载的;混合式在集群内用动态规划,集群间用记忆化。编码智能体使生成形状容易,但工程工艺在于洞见形状。