AI News HubLIVE
サイト内リライト3 分で読了

OpenAI Jalapeñoチップの背後にある数学

OpenAIはインフラコスト削減のため、Broadcomと協力してカスタムASIC「Jalapeño」を開発しました。このチップは大規模言語モデルの推論に特化しており、TSMCが製造し、2026年末までにデータセンターに導入される予定です。

ソースArtificial Intelligence News著者: Dashveenjit Kaur

OpenAIの財務軌道はインフラコストに大きく依存しており、この現実が新しいカスタムチップ「Jalapeño」の開発を促しました。Broadcomとの協力で開発されたこの特定用途向け集積回路(ASIC)は、サードパーティハードウェアに伴う巨額の設備投資を軽減する直接的な試みです。

現在、Nvidiaはそのハイエンドプロセッサで推定75%の利益率を誇っていますが、OpenAIはより薄いマージンで運営されており、巨額の運用経費を差し引いた後、1ドルあたり約33セントの利益しか残っていません。大規模言語モデルを大規模に実行するための財務的負担は深刻です。

昨年、ChatGPTサーバーの応答性を維持するために、OpenAIは驚異的な84億ドルを費やしました。現在、プラットフォームは週間9億ユーザーを引き付けており、今年の運用コストは約140億ドルに達すると予測されています。今後8年間で、OpenAIは計算能力に約1.4兆ドルをコミットしており、これは年間250億ドルの収益を生み出す企業にとって大きな賭けです。

Jalapeñoチップは、OpenAI初の「インテリジェンスプロセッサ」と呼ばれ、汎用AIワークロードではなく、大規模言語モデル(LLM)推論専用に構築されています。OpenAIは自社のモデルロードマップとサービングシステムに基づいてコアアーキテクチャ設計を提供し、Broadcomはシリコンエンジニアリングと高性能ネットワーキング統合を担当しました。

TSMCが台湾での物理製造を担当し、Celesticaがボードおよびラックシステムの構築を担当しています。OpenAIによると、初期のラボサンプルはすでに、未発表のGPT-5.3-Codex-Sparkモデルを含む最先端ワークロードを、目標の生産周波数と電力で実行しています。

OpenAIのハードウェアプログラム責任者Richard Ho氏は、このアーキテクチャがデータ移動を最小限に抑え、実現される利用率を理論上のピーク性能に近づけると述べています。従来のAIワークロードから適応された汎用アクセラレータとは異なり、このアーキテクチャは特にコンピュート、メモリ、ネットワークリソースのバランスをとり、インタラクティブなLLMサービングに固有のデータ移動ボトルネックを解決します。

これを大規模に実現するために、プラットフォームはBroadcomのTomahawkネットワーキングシリコンを直接設計に統合し、カスタムプロセッサが大規模なクラスタデータセンター環境全体で通信できるようにしています。

カスタムシリコンに参入することで、OpenAIは単なるソフトウェア層から垂直統合型インフラ企業へと移行します。このフルスタック戦略は、チップアーキテクチャ、ソフトウェアカーネル、メモリシステム、ネットワークスケジューリング、最終アプリケーション層に至るまでの全パイプラインを網羅しています。Appleの専有ハードウェアとiOSの緊密な結合と同様に、OpenAIは今や自社の内部モデルロードマップに合わせてインフラを最適化できます。

この統合は継続的な運用フライホイールを生み出します。強化されたインフラ効率により、モデルのトレーニングとサービングの両方のコストが削減されます。より手頃なサービングは、より良く、より応答性の高い製品につながり、ユーザーボリュームと収益を押し上げ、次の世代のカスタムインフラに再投資されます。

独自のシリコンを導入することで、OpenAIは主要な競合他社がほぼ10年にわたって専有ハードウェアを開発してきた環境に参入します。Googleは2015年にTPUの展開を開始し、現在Nvidiaのサプライチェーン外の世界のAIコンピューティング容量の約4分の1を掌握しています。

Amazonは100万個以上のカスタムチップを出荷し、MetaとMicrosoftは自社のインフラを拡大し続けています。

OpenAIの社長兼共同創業者であるGreg Brockman氏は、「Jalapeñoは、コンピュートをより豊富にするための長期的なフルスタックインフラ戦略の一部です。スタックのより多くの部分を自社で設計することで、より高い効率でより多くのインテリジェンスを提供できます」と述べています。

このタイムギャップを埋めるために、OpenAIは開発フェーズを加速しました。Jalapeñoチップは、白紙の設計から製造テープアウト(物理生産前の最終工程)までわずか9ヶ月で移行しました。エンジニアリングチームは、OpenAI自身の言語モデルを利用してハードウェア設計プロセスの一部を自動化および最適化することで、このタイムラインを達成しました。

これにより、ユーザーに提供されるモデルが、将来のイテレーションを実行する物理インフラを構築するために積極的に活用されるというユニークなフィードバックループが生まれます。ハードウェアのデータセンターへの初期導入は2026年末までに開始される予定です。

BroadcomのCEO Hock Tan氏は、Microsoftを含むインフラパートナーと共に展開を拡大し、ギガワット級のデータセンター統合に備えることを確認しました。