2026-06-20 19:20 UTC+8站内改写2 分钟阅读更新: 2026-06-22 07:31 UTC+8

今日构建密集的代理型AI CPU机架

随着代理型AI工作负载的兴起，CPU在数据中心中的重要性日益凸显。本文探讨了为何代理型AI主要消耗CPU资源而非GPU，并通过OpenClaw等框架展示了其部署方式。文章还分析了代理型AI带来的新需求，如从人工操作转向机器操作，以及基础设施需要为机器对机器流量优化。

来源Hacker News AI作者: ksec

随着代理型人工智能（Agentic AI）的快速发展，服务器CPU正在从被忽视的角色转变为关键基础设施。本文旨在提供一个更广阔的视角，帮助读者理解这一趋势及其对数据中心的影响。

当前，许多讨论聚焦于代理作为新型工作负载的运行，但代理型AI的实际影响远不止于此。2026年6月3日，Cloudflare首席执行官Matthew Prince指出，AI机器人流量已超过互联网上的人类流量。这一趋势真实存在，并将随着代理平台融入日常工作中而进一步加剧。服务器CPU因此变得炙手可热，提前布局的公司将获得显著优势。

为什么代理型AI是CPU的故事？在数据中心，CPU无处不在：它们与GPU协同处理数据、为加速器附加内存池、运行存储节点、控制平面、Kubernetes工作负载、网络交换机甚至部分网络适配器。构建集群时，CPU是共同的组成部分。

代理型AI改变了CPU的使用方式。像OpenClaw、Hermes这样的平台并不在GPU上运行，它们依赖CPU，并且需要持续存活和响应。通过简单的安装命令即可部署OpenClaw，然后在公司环境中，应将其视为承包商而非YOLO（全开权限）模式：授予受限的数据和服务访问权限。

LLM推理通常通过API调用GPU，而CPU端基础设施处理其余一切。如果需要确定性和可重复的结果，应让LLM生成脚本在CPU上运行任务，而不是依赖原始LLM输出直接执行命令。例如，为SSH登录设置一个带密码认证的sudo用户，然后交给LLM处理100次调用。即使使用强大模型，仍会有显著比例的调用因格式错误而失败。通过构建特定工具修复访问路径，将LLM格式化调用与确定性部分分离，可大幅减少错误和令牌消耗。

CPU的另一个关键应用是创建短暂沙盒：创建、执行命令、然后销毁。这些沙盒运行在CPU上，而代理本身也运行在CPU或云VPS实例上。决定代理性能的关键因素与LLM本身无关。

代理型AI的重要性在于，机器作为操作者的新工作负载正在取代人类。为了最终走向确定性路径，需要将更多工作推给CPU。Cloudflare的机器人流量数据表明，运行这些机器人消耗了大量CPU能力。此外，代理请求往往需要访问前端应用和数据库，这些服务都运行在CPU上。随着机器对机器流量的增加，应用程序必须优化以处理比人类更大的请求量。

作者以自身经历为例：PwC工作期间，他曾帮助一家存储供应商自动化定价和折扣流程，使其销售速度远超竞争对手。代理型AI带来的超时窗口要求基础设施快速响应，这正推动着服务器CPU的演进。