不足がシリコンバレー外でAIイノベーションを促進
計算コストの上昇とエネルギー制約の強化により、シリコンバレーなどのテクノロジーハブへのAIインフラ集中が挑戦を受けている。世界各地で、インドのShakti Cloud、アフリカのCassava、ブラジルのSoberanIA、UAEのCore42などの例に見られるように、地域資源を活用した主権AIインフラの構築が進んでいる。推論需要がAI計算の地図を再形成し、分散型インフラを必要とする。
長年にわたり、人工知能インフラに関する前提は、大規模な計算施設がハイパースケールクラウド、開発者密度、資本が集中する場所(シリコンバレー、シアトル、ロンドンなど少数のテクノロジーハブ)に建設されるというものでした。この地理的集中には実際的な理由がありました。大規模なAIの訓練と展開には、データセンター、計算能力、ネットワーク容量、エネルギー、先進的なインフラが必要です。この依存は次第に市場集中へと固まり、アマゾン、マイクロソフト、グーグルで世界のエンタープライズクラウドインフラ支出の約3分の2を占めています。
しかし、その古い論理はもはや通用しません。計算はより高価で、より電力を消費し、少数の支配的なプロバイダー以外では入手が難しくなっています。開発者は次のような質問に直面し始めています:電力はどこから来るのか?チップはこの管轄区域に出荷できるか?データが移動した場合、どの国の法律が適用されるのか?これらの質問への答えは、ますますシリコンバレーの外で見つかっています。
不足が教えること 確立されたクラウド市場では、高まるAI需要へのデフォルトの答えは、より大規模なクラウド契約、より密集したデータセンター建設、同じ中央集権スタックへのより深い依存を通じて容量を増やすことです。2024年、データセンターは世界の電力の約1.5%を消費し、エネルギーをAIインフラの圧力ポイントの一つにするのに十分でした。この割合は2030年までに約3%に上昇すると予測され、計算をAI製品の背後にある隠れた層として扱うことを難しくしています。
発展途上世界の多くでは、その圧力が出発点です。開発者は計算アクセス、電力、配信を他人の問題として扱う選択肢を持つことはめったにありませんでした。彼らはそのために設計しなければならなかったのです。その結果、深刻なAIインフラは、不足を後付けではなく設計問題として扱う場所で建設されています。
このパターンは4つの場所で最も顕著です。インドでは、Yotta Data Servicesが16,000基以上のNvidia H100 GPUでShakti Cloudを運営し、追加を計画しています。インドAIミッション(政府の国産基盤モデル構築プログラム)の計算能力の半分以上がYottaのハードウェア上にあります。今年初め、多言語プラットフォームBhashiniは外国のハイパースケーラーからShakti Cloudに移行しました。Bhashiniは11のインド言語でリアルタイム翻訳を実行しており、自ら統治できないインフラは受け入れられないという決定が下されました。
アフリカでは、ジンバブエの起業家Strive Masiyiwaが設立したCassava Technologiesが、南アフリカ、エジプト、ケニア、モロッコ、ナイジェリアのデータセンターに12,000基のNvidia GPUを展開しています。Cassavaは大陸初のNvidiaクラウドパートナーです。この展開以前、Nvidiaはアフリカ大陸全体に約80基のGPUが設置されていると推定していました。制約は価格だけでなく、高度なシリコンの欠如でした。Cassavaの対応は、自社の光ファイバーバックボーン上で動作する汎アフリカネットワークであり、アフリカのスタートアップ、研究者、政府がAIを訓練・展開するために欧州や米国を経由する必要がないようにするものです。
ブラジルでは、政府のSoberanIAプロジェクトがピアウイ州に500メガワットを主権AI工場のために確保し、完全に再生可能エネルギーで電力を供給します。Scala Data Centersが主要なインフラパートナーです。ブラジルは今後10年間で最大3700億ドルのデータセンター投資を呼び込むことを約束し、100%再生可能電力を調達するプロジェクトに税制優遇措置を提供しています。ブラジルのデータの約65%は依然として海外に保存されています。豊富な水力と太陽光発電が、データセンター電力が依然としてガスや石炭に大きく依存している市場よりもクリーンな出発点をブラジルに与えるという賭けです。
アラブ首長国連邦は最も高額なルートを取っています。G42グループの一部であるCore42は、NvidiaとQualcommのチップを組み合わせた推論容量を販売しており、UAEは米国と協力して、10平方マイル、5ギガワットのAIキャンパスを建設することを約束し、今年代末までに部分的に稼働する予定です。UAEの提案は率直です:主権AIを望むが、基盤となるスタックを自ら構築できない国は、友好的な政府からレンタルできるというものです。これは、チップ、電力、データセンター、外国関係を一度に所有するという、意図的な垂直統合戦略です。
これらのプロジェクトはすべて、計算アクセス、電力、土地、チップ供給を外部性ではなく第一級の設計問題として扱うという初期前提を共有しています。その前提が異なるインフラを生み出します。
推論が地図を変える理由 大規模モデルの訓練は依然として密集したクラスター、大規模な資本、先進的なチップへのアクセスを重視します。その作業がすぐに最大のハイパースケール施設を離れる可能性は低いです。
推論は異なります。モデルは顧客、デバイス、エージェント、エンタープライズシステムによって継続的に使用されます。マッキンゼーは、2030年までに推論がAIデータセンターで訓練を追い越し、AI計算の半分以上、データセンター需要の約30%〜40%を占めると予想しています。
推論にとって、問題は計算がどこにあるべきか、どれだけ速く応答できるか、ワークロードをどれだけ確実にルーティングできるか、データにどの国の法律が適用されるかです。これらの質問には地理的な意味があり、ハイパースケール集中は特に、米国や欧州のデータセンターから容易なレイテンシ内に住んでいない数十億の人々に対してうまく対応できません。
推論需要に必要な計算ファブリックは、ハイパースケールクラウドだけが提供できるものよりも広範です。分散GPU容量、リージョナル推論クラスター、主権クラウド、そしてムンバイ、ナイロビ、サンパウロ、アブダビなどの場所に出現する新興の「ネオクラウド」は、ハイパースケールの代替ではなく、ハイパースケールだけではサービスできない層です。
古いAIインフラの地図は、クラウド容量がすでに集中している場所の周りに描かれていました。この地図は、計算が安価で豊富だった時代には理にかなっていました。新しい地図は異なって見えるでしょう。それは、計算が高価で戦略的であるときに構築することを学び、スタックを誰が制御するかという問題がより重要である場所の周りに描かれるでしょう。新しい地図を描いている企業や政府はシリコンバレーに追いついているのではありません。彼らはそうせざるを得なかったために最初に問題に到達したのです。