AI News HubLIVE
サイト内リライト3 分で読了

本日、高密度エージェンティックAI CPUラックを構築する

エージェンティックAIワークロードの台頭により、CPUが重要なインフラストラクチャになりつつあります。本稿では、なぜエージェンティックAIがGPUではなく主にCPUリソースを消費するのかを探り、OpenClawなどのフレームワークによる展開方法を示し、人間から機械への運用シフトが機械対機械トラフィックに最適化されたインフラを必要とすることを分析します。

ソースHacker News AI著者: ksec

エージェンティックAI(自律型AI)の急速な発展に伴い、サーバーCPUは脇役から重要なインフラストラクチャへと変貌しています。本稿では、このトレンドとデータセンターへの影響を理解するための広範な枠組みを提供します。

現在、多くの議論はエージェントを新しいワークロードとして実行することに焦点を当てていますが、その影響ははるかに大きいです。2026年6月3日、CloudflareのCEOであるMatthew Prince氏は、AIボットのトラフィックがインターネット上の人間のトラフィックを上回ったと述べました。この傾向は現実であり、エージェントプラットフォームが日常業務に組み込まれるにつれてさらに悪化します。サーバーCPUが注目される理由はここにあり、先手を打つ企業は大きな優位性を得るでしょう。

なぜエージェンティックAIはCPUの物語なのか?データセンターでは、CPUは至る所に存在します。GPUと連携してデータを処理し、アクセラレータに追加メモリを提供し、ストレージノード、コントロールプレーン、Kubernetesワークロード、ネットワークスイッチ、さらには一部のネットワークアダプタを実行します。クラスターを構築するとき、CPUは共通の要素です。

エージェンティックAIはCPUの使用方法を変えます。OpenClawやHermesのようなプラットフォームはGPU上では動作せず、CPU上で実行され、常に稼働して応答できる状態を維持する必要があります。簡単なインストールコマンドでOpenClawをデプロイできますが、企業環境では、YOLO(全権限開放)モードではなく、請負業者のように制限付きのアクセス権限を付与することが推奨されます。

LLM推論は通常、API経由でGPUを呼び出しますが、CPU側のインフラストラクチャがその他すべてを処理します。決定論的で再現可能な結果が必要な場合は、LLMにスクリプトを生成させてCPU上でタスクを実行させるべきであり、LLMの生の出力を直接コマンド実行に使用するべきではありません。例えば、パスワード認証付きのSSHユーザーを設定し、LLMに100回の呼び出しを処理させると、強力なモデルであってもかなりの割合でフォーマットエラーが発生します。特定のアクセスパス用のツールを構築することで、LLMの呼び出しフォーマットと決定論的部分を分離し、エラーとトークン消費を大幅に削減できます。

CPUのもう一つの重要な用途は、短期間のサンドボックス作成です。サンドボックスを作成し、コマンドを実行し、破棄します。これらのサンドボックスはCPU上で実行され、エージェント自体もベアメタルマシンやクラウドVPS上で動作します。エージェントのパフォーマンスを決定する要因はLLM自体とは無関係です。

エージェンティックAIの重要性は、人間のオペレーターから機械のオペレーターへの移行にあります。決定論的なパスを最終的に目指すには、より多くの処理をCPUに移す必要があります。Cloudflareのボットトラフィックデータは、ボットの実行がCPU能力を消費することを示しています。さらに、エージェントからのリクエストはフロントエンドアプリケーションやデータベースにアクセスすることが多く、これらのサービスもCPU上で動作します。機械対機械トラフィックの増加に伴い、アプリケーションは人間だけでなく、はるかに多くのエージェントからのリクエストを処理できるように最適化される必要があります。

著者は自身の経験を例に挙げています。PwC勤務時、医療機器会社の注文から請求書までのプロセスを自動化し、またストレージプロバイダーの価格設定と割引ワークフローを自動化して、競合他社よりも迅速な見積もりと取引を実現しました。エージェンティックAIも同様にタイムアウトウィンドウを持ち、インフラストラクチャは迅速に応答する必要があり、それがサーバーCPUの進化を促進しています。