AI News HubLIVE
站内改写1 分钟阅读

为何CPU在AI代理时代依然重要

尽管AI基础设施的讨论常聚焦于GPU和TPU,但CPU在AI从聊天机器人转向自主代理的过程中扮演着关键角色,作为“空中交通管制员”协调任务,并支持沙盒环境以确保安全。ARM和Google的专家解释了CPU在处理工具调用、内存管理和轻量级模型运行中的优势。

来源The New Stack AI作者: Frederic Lardinois

在AI基础设施的讨论中,GPU和TPU几乎占据了所有头条,但CPU——这个鲜少被提及的芯片——在AI从聊天机器人向自主代理的转变中正变得愈发重要。The New Stack与Arm公司的Bhumik Patel以及Google的Mo Farhat进行了对话,探讨了CPU在新时代的关键作用。

Farhat将CPU比作“空中交通管制员”,负责协调代理完成任务。与早期仅返回响应的聊天机器人不同,自主代理能够执行操作:调用工具、创建环境并运行代码。这些任务——包括编排、API通信和内存管理——正是CPU擅长的并发分布式工作。此外,CPU也能运行小型模型(如摘要器、分类器),对于80亿参数级别的模型,CPU已提供良好性能,且未来有望处理更大负载。

代理运行代码时需要安全隔离。Google推荐其开源项目gVisor,作为应用与操作系统之间的隔离层。通过GKE Agent Sandbox,Google可以实现每集群每秒启动300个沙盒,且首个指令延迟低于1秒。代理工作负载具有突发性,因此平台利用Pod快照和预热池来降低空闲成本。

效率是另一大优势。Google Cloud Next上,Google宣称其基于ARM的Axion处理器在GKE Agent Sandbox中比领先云提供商提供“30%更好的性价比”。Axion N4A实例针对成本和效率优化,适合沙盒环境;而C4A实例则针对单线程性能调优,适用于有状态编排和控制流逻辑。对于云原生开发者而言,这些工具非常熟悉,并自然延伸至代理化方法。总体而言,CPU正在AI代理时代重新焕发活力,成为不可或缺的基础设施组件。