2026-06-20 19:20 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-22 07:31 UTC+8

今日構建密集的代理型AI CPU機架

隨着代理型AI工作負載的興起，CPU在數據中心中的重要性日益凸顯。本文探討了為何代理型AI主要消耗CPU資源而非GPU，並通過OpenClaw等框架展示了其部署方式。文章還分析了代理型AI帶來的新需求，如從人工操作轉向機器操作，以及基礎設施需要為機器對機器流量優化。

來源Hacker News AI作者: ksec

隨着代理型人工智能（Agentic AI）的快速發展，服務器CPU正在從被忽視的角色轉變為關鍵基礎設施。本文旨在提供一個更廣闊的視角，幫助讀者理解這一趨勢及其對數據中心的影響。

當前，許多討論聚焦於代理作為新型工作負載的運行，但代理型AI的實際影響遠不止於此。2026年6月3日，Cloudflare首席執行官Matthew Prince指出，AI機器人流量已超過互聯網上的人類流量。這一趨勢真實存在，並將隨着代理平台融入日常工作中而進一步加劇。服務器CPU因此變得炙手可熱，提前佈局的公司將獲得顯著優勢。

為什麼代理型AI是CPU的故事？在數據中心，CPU無處不在：它們與GPU協同處理數據、為加速器附加內存池、運行存儲節點、控制平面、Kubernetes工作負載、網絡交換機甚至部分網絡適配器。構建集羣時，CPU是共同的組成部分。

代理型AI改變了CPU的使用方式。像OpenClaw、Hermes這樣的平台並不在GPU上運行，它們依賴CPU，並且需要持續存活和響應。通過簡單的安裝命令即可部署OpenClaw，然後在公司環境中，應將其視為承包商而非YOLO（全開權限）模式：授予受限的數據和服務訪問權限。

LLM推理通常通過API調用GPU，而CPU端基礎設施處理其餘一切。如果需要確定性和可重複的結果，應讓LLM生成腳本在CPU上運行任務，而不是依賴原始LLM輸出直接執行命令。例如，為SSH登錄設置一個帶密碼認證的sudo用户，然後交給LLM處理100次調用。即使使用強大模型，仍會有顯著比例的調用因格式錯誤而失敗。通過構建特定工具修復訪問路徑，將LLM格式化調用與確定性部分分離，可大幅減少錯誤和令牌消耗。

CPU的另一個關鍵應用是創建短暫沙盒：創建、執行命令、然後銷燬。這些沙盒運行在CPU上，而代理本身也運行在CPU或雲VPS實例上。決定代理性能的關鍵因素與LLM本身無關。

代理型AI的重要性在於，機器作為操作者的新工作負載正在取代人類。為了最終走向確定性路徑，需要將更多工作推給CPU。Cloudflare的機器人流量數據表明，運行這些機器人消耗了大量CPU能力。此外，代理請求往往需要訪問前端應用和數據庫，這些服務都運行在CPU上。隨着機器對機器流量的增加，應用程序必須優化以處理比人類更大的請求量。

作者以自身經歷為例：PwC工作期間，他曾幫助一家存儲供應商自動化定價和折扣流程，使其銷售速度遠超競爭對手。代理型AI帶來的超時窗口要求基礎設施快速響應，這正推動着服務器CPU的演進。