2026-06-04 02:54 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

為何CPU在AI代理時代依然重要

儘管AI基礎設施的討論常聚焦於GPU和TPU，但CPU在AI從聊天機器人轉向自主代理的過程中扮演着關鍵角色，作為“空中交通管制員”協調任務，並支持沙盒環境以確保安全。ARM和Google的專家解釋了CPU在處理工具調用、內存管理和輕量級模型運行中的優勢。

來源The New Stack AI作者: Frederic Lardinois

在AI基礎設施的討論中，GPU和TPU幾乎佔據了所有頭條，但CPU——這個鮮少被提及的芯片——在AI從聊天機器人向自主代理的轉變中正變得愈發重要。The New Stack與Arm公司的Bhumik Patel以及Google的Mo Farhat進行了對話，探討了CPU在新時代的關鍵作用。

Farhat將CPU比作“空中交通管制員”，負責協調代理完成任務。與早期僅返回響應的聊天機器人不同，自主代理能夠執行操作：調用工具、創建環境並運行代碼。這些任務——包括編排、API通信和內存管理——正是CPU擅長的併發分佈式工作。此外，CPU也能運行小型模型（如摘要器、分類器），對於80億參數級別的模型，CPU已提供良好性能，且未來有望處理更大負載。

代理運行代碼時需要安全隔離。Google推薦其開源項目gVisor，作為應用與操作系統之間的隔離層。通過GKE Agent Sandbox，Google可以實現每集羣每秒啓動300個沙盒，且首個指令延遲低於1秒。代理工作負載具有突發性，因此平台利用Pod快照和預熱池來降低空閒成本。

效率是另一大優勢。Google Cloud Next上，Google宣稱其基於ARM的Axion處理器在GKE Agent Sandbox中比領先雲提供商提供“30%更好的性價比”。Axion N4A實例針對成本和效率優化，適合沙盒環境；而C4A實例則針對單線程性能調優，適用於有狀態編排和控制流邏輯。對於雲原生開發者而言，這些工具非常熟悉，並自然延伸至代理化方法。總體而言，CPU正在AI代理時代重新煥發活力，成為不可或缺的基礎設施組件。