AI News HubLIVE
站內改寫2 分鐘閱讀

今日構建密集的代理型AI CPU機架

隨着代理型AI工作負載的興起,CPU在數據中心中的重要性日益凸顯。本文探討了為何代理型AI主要消耗CPU資源而非GPU,並通過OpenClaw等框架展示了其部署方式。文章還分析了代理型AI帶來的新需求,如從人工操作轉向機器操作,以及基礎設施需要為機器對機器流量優化。

來源Hacker News AI作者: ksec

隨着代理型人工智能(Agentic AI)的快速發展,服務器CPU正在從被忽視的角色轉變為關鍵基礎設施。本文旨在提供一個更廣闊的視角,幫助讀者理解這一趨勢及其對數據中心的影響。

當前,許多討論聚焦於代理作為新型工作負載的運行,但代理型AI的實際影響遠不止於此。2026年6月3日,Cloudflare首席執行官Matthew Prince指出,AI機器人流量已超過互聯網上的人類流量。這一趨勢真實存在,並將隨着代理平台融入日常工作中而進一步加劇。服務器CPU因此變得炙手可熱,提前佈局的公司將獲得顯著優勢。

為什麼代理型AI是CPU的故事?在數據中心,CPU無處不在:它們與GPU協同處理數據、為加速器附加內存池、運行存儲節點、控制平面、Kubernetes工作負載、網絡交換機甚至部分網絡適配器。構建集羣時,CPU是共同的組成部分。

代理型AI改變了CPU的使用方式。像OpenClaw、Hermes這樣的平台並不在GPU上運行,它們依賴CPU,並且需要持續存活和響應。通過簡單的安裝命令即可部署OpenClaw,然後在公司環境中,應將其視為承包商而非YOLO(全開權限)模式:授予受限的數據和服務訪問權限。

LLM推理通常通過API調用GPU,而CPU端基礎設施處理其餘一切。如果需要確定性和可重複的結果,應讓LLM生成腳本在CPU上運行任務,而不是依賴原始LLM輸出直接執行命令。例如,為SSH登錄設置一個帶密碼認證的sudo用户,然後交給LLM處理100次調用。即使使用強大模型,仍會有顯著比例的調用因格式錯誤而失敗。通過構建特定工具修復訪問路徑,將LLM格式化調用與確定性部分分離,可大幅減少錯誤和令牌消耗。

CPU的另一個關鍵應用是創建短暫沙盒:創建、執行命令、然後銷燬。這些沙盒運行在CPU上,而代理本身也運行在CPU或雲VPS實例上。決定代理性能的關鍵因素與LLM本身無關。

代理型AI的重要性在於,機器作為操作者的新工作負載正在取代人類。為了最終走向確定性路徑,需要將更多工作推給CPU。Cloudflare的機器人流量數據表明,運行這些機器人消耗了大量CPU能力。此外,代理請求往往需要訪問前端應用和數據庫,這些服務都運行在CPU上。隨着機器對機器流量的增加,應用程序必須優化以處理比人類更大的請求量。

作者以自身經歷為例:PwC工作期間,他曾幫助一家存儲供應商自動化定價和折扣流程,使其銷售速度遠超競爭對手。代理型AI帶來的超時窗口要求基礎設施快速響應,這正推動着服務器CPU的演進。