AI News HubLIVE
站内改写2 分钟阅读

今日构建密集的代理型AI CPU机架

随着代理型AI工作负载的兴起,CPU在数据中心中的重要性日益凸显。本文探讨了为何代理型AI主要消耗CPU资源而非GPU,并通过OpenClaw等框架展示了其部署方式。文章还分析了代理型AI带来的新需求,如从人工操作转向机器操作,以及基础设施需要为机器对机器流量优化。

来源Hacker News AI作者: ksec

随着代理型人工智能(Agentic AI)的快速发展,服务器CPU正在从被忽视的角色转变为关键基础设施。本文旨在提供一个更广阔的视角,帮助读者理解这一趋势及其对数据中心的影响。

当前,许多讨论聚焦于代理作为新型工作负载的运行,但代理型AI的实际影响远不止于此。2026年6月3日,Cloudflare首席执行官Matthew Prince指出,AI机器人流量已超过互联网上的人类流量。这一趋势真实存在,并将随着代理平台融入日常工作中而进一步加剧。服务器CPU因此变得炙手可热,提前布局的公司将获得显著优势。

为什么代理型AI是CPU的故事?在数据中心,CPU无处不在:它们与GPU协同处理数据、为加速器附加内存池、运行存储节点、控制平面、Kubernetes工作负载、网络交换机甚至部分网络适配器。构建集群时,CPU是共同的组成部分。

代理型AI改变了CPU的使用方式。像OpenClaw、Hermes这样的平台并不在GPU上运行,它们依赖CPU,并且需要持续存活和响应。通过简单的安装命令即可部署OpenClaw,然后在公司环境中,应将其视为承包商而非YOLO(全开权限)模式:授予受限的数据和服务访问权限。

LLM推理通常通过API调用GPU,而CPU端基础设施处理其余一切。如果需要确定性和可重复的结果,应让LLM生成脚本在CPU上运行任务,而不是依赖原始LLM输出直接执行命令。例如,为SSH登录设置一个带密码认证的sudo用户,然后交给LLM处理100次调用。即使使用强大模型,仍会有显著比例的调用因格式错误而失败。通过构建特定工具修复访问路径,将LLM格式化调用与确定性部分分离,可大幅减少错误和令牌消耗。

CPU的另一个关键应用是创建短暂沙盒:创建、执行命令、然后销毁。这些沙盒运行在CPU上,而代理本身也运行在CPU或云VPS实例上。决定代理性能的关键因素与LLM本身无关。

代理型AI的重要性在于,机器作为操作者的新工作负载正在取代人类。为了最终走向确定性路径,需要将更多工作推给CPU。Cloudflare的机器人流量数据表明,运行这些机器人消耗了大量CPU能力。此外,代理请求往往需要访问前端应用和数据库,这些服务都运行在CPU上。随着机器对机器流量的增加,应用程序必须优化以处理比人类更大的请求量。

作者以自身经历为例:PwC工作期间,他曾帮助一家存储供应商自动化定价和折扣流程,使其销售速度远超竞争对手。代理型AI带来的超时窗口要求基础设施快速响应,这正推动着服务器CPU的演进。