AI News HubLIVE
站内改写5 分で読了

AIがクラウドを離れる:Computex 2026の大規模チップ需要シグナル

Computex 2026で、NVIDIAとQualcommはAIがクラウドからエッジデバイスへ移行する傾向を示し、AIエージェントがPCやスマートフォンなどで動作する可能性を強調し、チップ需要構造を変革する。

ソースHacker News AI著者: haebom

今年のComputex 2026で最も印象的だったのは、新製品が多数発表されたことではなく、AIの実行場所の変化でした。過去数年間、AIコンピューティングの中心はほぼ完全にクラウドにあり、大規模言語モデルはデータセンターで動作し、ユーザーはブラウザやアプリを通じて結果を受け取る構造でした。しかし、NVIDIAとQualcommが今回の展示会で共通して示した方向性は異なります。将来のAIエージェントはクラウドに留まらず、PC、スマートフォン、ワークステーション、ロボット、自動車、産業機器など多様なデバイスに広がる可能性が高いです。この変化は単なる「AI PCの登場」を超え、GPUだけでなくCPU、DRAM、LPDDR、HBM、DPU、ネットワーク、冷却、パッケージング、基板、電力インフラまで需要構造を変える可能性があります。

  1. エージェントをクライアントデバイスへ

NVIDIAが展示会で発表した最も重要な製品の一つは、MediaTekと協力して開発したWindows PC向けプロセッサN1Xと、それをベースにしたRTX Sparkでした。これは単なるAI PCチップではなく、高性能AIエージェントをローカルデバイスで実行する試みに近いです。NVIDIAはRTX Sparkが約1 PFLOPSのAI性能と100万コンテキストウィンドウで1200億パラメータのLLMを実行できると説明しました。これはPCが単なる「AIを使用するデバイス」からAIモデルを実行し、エージェントを動かし、個人データを処理する個人用AIサーバーになることを意味します。成功の鍵は、エージェンティックAIを前提としたアプリケーションエコシステムの再構築と、既存のx86 Windowsアプリケーションとの互換性の解決です。MediaTekにとって、この製品は短期的な売上貢献は1〜2%程度と小さいかもしれませんが、Windowsコンピューティング分野での存在感を高める契機となります。

  1. Qualcommのビジョン:エージェントは単一デバイスに縛られない

Qualcommは基調講演で大型新製品を発表しませんでしたが、6月のアナリストデーで詳細が明らかになるDragonfly AIサーバーラックに触れました。注目すべきは、Qualcommが推論特化ASICとデータセンターCPU分野に参入しつつあることです。サプライチェーンによると、推論ASICはByteDanceと米国のハイパースケーラー1社を対象とし、2027年から本格的に量産される見込みです。QualcommのCEOクリスティアーノ・アモン氏は、2026年から2030年までにトークン消費量が40倍に増加すると予測し、AI推論需要の爆発的増加を示唆しました。ただし、Qualcommはすべての推論がクラウドで行われるわけではなく、エージェンティックAIワークロードはデバイスとクラウドに分散されると考えています。例えば、コーディングやウェブページ生成などのタスクは、デバイスとクラウドを組み合わせることでトークン使用量を30〜60%削減し、高速化できます。この見解は重要です。AIがクラウドのみで実行される場合、恩恵は主にデータセンターのGPU、HBM、ネットワーク、電力インフラに集中します。しかし、AIがエッジに広がると、スマートフォン、PC、ノートPC、ワークステーション、オンデバイスメモリ、低消費電力CPU/GPU/NPU、LPDDR需要も連動して動くため、AI半導体投資の地図が広がります。

  1. エージェントAIはハードウェアスタックの問題

NVIDIAとQualcommが今回共通して強調したのはエージェンティックAIでした。NVIDIAはAIエージェントを4つの構成要素(LLM、ブレイン、ツール/ランタイム、作業環境)に分解しました。これはエージェントを単なるチャットボットと見なさないためであり、エージェントはモデルだけでは完結せず、ツールを呼び出し、外部環境で作業し、オーケストレーションされ、実行結果を反映する構造です。必要なハードウェアもGPUだけでは終わりません。NVIDIAはエージェンティックAIに必要なハードウェアスタックにGPU、CPU、DPUがすべて含まれると説明しました。AIインフラは単に「GPUをより多く購入する」ではなく、CPUがデータを準備し、GPUが計算し、DPUがネットワークとデータ移動を処理し、ストレージとメモリがそれを支え、冷却と電力がシステム全体を維持する必要があります。この観点から、NVIDIAは単なるGPU企業ではなく、AIファクトリー全体のフルスタック設計者になろうとしています。Cadenceとのチップ設計スーパーエージェント協力は、検証期間を数週間から数時間に短縮し、約40倍の高速化を実現した事例であり、エージェンティックAIが単なる業務自動化ではなく、半導体設計のような高付加価値産業にも深く浸透できることを示しています。

  1. Vera Rubin:GPUラックは共同設計システムに

NVIDIAはVera Rubinが本格量産中であることを確認し、Microsoft、Dell、CoreWeaveがすでにエンジニアリングラックを構築しており、大規模生産は今年第4四半期に開始される可能性が高いと述べました。Vera Rubinの重要な点は性能だけではなく、ラック全体が共同設計されたシステムになっていることです。前世代のBlackwellではラック組み立てに約2時間かかりましたが、Vera Rubinラックはケーブルとファンの数を減らし、液体冷却とインターコネクション用ミッドプレーンPCBを活用することで、組み立て時間が約5分に短縮されます。この変化はサプライチェーンの観点から非常に重要です。AIサーバーはもはやGPUカードを数枚挿すだけの単純なサーバーではなく、GPU、CPU、DPU、ストレージ、スイッチ、光通信、液体冷却、電源装置、PCB、コールドプレート、QD、ラック統合がすべて連動した高密度システムです。Vera RubinはVera GPU、Vera CPU、BlueField DPU、ストレージラック、Co-Packaged Opticsを搭載したSpectrum SPXラック、高速トークン処理のためのLPXを統合します。目標はGB300比で10倍のトークン処理量とワットあたりの収益最大化です。ボトルネックは依然としてHBM4供給、CoWoS-Lパッケージング、先進基板、液体冷却、電力インフラにあります。そのため、NVIDIAが強力になってもサプライチェーン全体の恩恵は大きいと見られます。米国ではTSMC、AMKR、ASE、COHR、VRT、Dell、SMCI、CLSなど、韓国ではSKハイニックス、サムスン電子、サムスン電機、ハンミ半導体、テックウィング、ISC、パークシステムズなどが関連します。

  1. Vera CPU:AI推論はGPUからCPUへ拡大

今回の展示会でジェンスン・フアン氏が多くの時間を割いたのはVera CPUでした。NVIDIAはVera CPUをエージェンティックAIワークロードに特化したCPUとして位置づけています。経営陣によると、Vera CPUはx86比で約1.8倍のエージェンティックAIサンドボックス性能を提供し、世界最高レベルのIPCを備えています。技術的にも興味深い点が多く、Vera CPUはPCIe 6と1.2TB/sのLPDDR5Xメモリを実装し、内部と外部の両方で3倍の帯域幅を提供しながらピークメモリレイテンシを40%低減しました。データベースワークロードではx86よりもSQLを3倍高速に実行すると説明しています。これはAI半導体市場においてCPUが再び重要になる可能性を示しています。過去数年間、AI投資は事実上GPU中心でしたが、エージェンティックAIは異なります。エージェントはモデル推論だけでなく、データ検索、データベース照会、ツール実行、サンドボックス環境でのコード実行、複数タスクの並列管理を必要とし、その過程でCPUの役割が再び大きくなります。特にAIサーバー内のCPU-GPU帯域幅、メモリ帯域幅、低レイテンシデータ処理能力が重要です。Vera CPUは2026年下半期に出荷を開始し、2026年に60万ユニット、2027年に300万ユニットを見込んでいます。