2026-06-04 02:54 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

为何CPU在AI代理时代依然重要

尽管AI基础设施的讨论常聚焦于GPU和TPU，但CPU在AI从聊天机器人转向自主代理的过程中扮演着关键角色，作为“空中交通管制员”协调任务，并支持沙盒环境以确保安全。ARM和Google的专家解释了CPU在处理工具调用、内存管理和轻量级模型运行中的优势。

来源The New Stack AI作者: Frederic Lardinois

在AI基础设施的讨论中，GPU和TPU几乎占据了所有头条，但CPU——这个鲜少被提及的芯片——在AI从聊天机器人向自主代理的转变中正变得愈发重要。The New Stack与Arm公司的Bhumik Patel以及Google的Mo Farhat进行了对话，探讨了CPU在新时代的关键作用。

Farhat将CPU比作“空中交通管制员”，负责协调代理完成任务。与早期仅返回响应的聊天机器人不同，自主代理能够执行操作：调用工具、创建环境并运行代码。这些任务——包括编排、API通信和内存管理——正是CPU擅长的并发分布式工作。此外，CPU也能运行小型模型（如摘要器、分类器），对于80亿参数级别的模型，CPU已提供良好性能，且未来有望处理更大负载。

代理运行代码时需要安全隔离。Google推荐其开源项目gVisor，作为应用与操作系统之间的隔离层。通过GKE Agent Sandbox，Google可以实现每集群每秒启动300个沙盒，且首个指令延迟低于1秒。代理工作负载具有突发性，因此平台利用Pod快照和预热池来降低空闲成本。

效率是另一大优势。Google Cloud Next上，Google宣称其基于ARM的Axion处理器在GKE Agent Sandbox中比领先云提供商提供“30%更好的性价比”。Axion N4A实例针对成本和效率优化，适合沙盒环境；而C4A实例则针对单线程性能调优，适用于有状态编排和控制流逻辑。对于云原生开发者而言，这些工具非常熟悉，并自然延伸至代理化方法。总体而言，CPU正在AI代理时代重新焕发活力，成为不可或缺的基础设施组件。