出力最大化の教授 — Anjney Midha、AMP
Anjney Midha が AI コンピュートの浪費問題、ノード利用率や MFU の重要性、そして AMP が構築する FLOPs をメガワットのように流すコンピュートグリッドのビジョンについて語る。彼は責任あるインフラ、コミュニティインセンティブ、反復的スケーリング、資本と実行のアライメントを提唱し、AI の真のボトルネックはシステム効率にあると指摘する。
ポッドキャストの最新エピソードで、swyx は AMP の創業者兼 CEO Anjney Midha と、AI コンピュートの浪費と解決策について深く掘り下げた。Anjney は、GPU 競争の焦点をシステム効率に移すべきだと指摘する。例えば、xAI の MFU は 10% 未満だが、業界最高は 60-70% に達し、Google 内部ではノード利用率 95% 未満は障害と見なされる。この非効率は技術的な無能さではなく、資金調達からクラスタ管理に至るまでの「アライメント」の問題であり、初期のわずかなズレがスケールで拡大する。
Anjney は AI インフラの拡張には「move fast, break things」ではなく「move fast with responsible infrastructure」が必要だと主張する。データセンター建設はコミュニティの反発に直面しており、米国の新規プロジェクトの最大 20% が頓挫する可能性がある。彼の提案は、GPU 時間あたり 0.5 ドルの追加料金を地域に直接還元することで、住民の支持を得るというものだ。これにより、電力網や環境への懸念を軽減し、信頼性の高いコンピュートを確保できる。
AMP のビジョンは、独立したコンピュートグリッドを構築し、FLOPs を電力のように流動的にすることだ。電力系統の独立系統運用機関(ISO)モデルに触発され、動的優先順位付けと中断可能需要管理を通じて、アイドルコンピュートを効率的に割り当てる。Anjney は AMP の目標として 1.2GW のベースロードと 6GW のスパイク容量を挙げ、20 年以上の実績があるデータセンター事業者との協力を重視する。また、DeepMind のような未公開研究が負の外部性を生むと批判し、よりオープンな知識共有を求める。
Anjney は Anthropic の成功について、初期からコーディングを最優先事項とし、資金が限られていたことが規律を生んだと分析する。過剰な資金は逆に AI ラボを脆弱にするという。研究者が CEO に転身する現象については、VC は科学者の経営能力を過小評価しており、優れた CEO は複数の階層で対決できる能力が必要だと述べる。
最後に、フロンティア AI の競争は「勝つ」ことではなく「リードする」ことが重要であり、物理学の制約と現実技術を組み合わせた真のブレークスルーが求められる。シリコンバレーには宣教師のような使命感と傭兵のような利益追求の両面があるが、そのバランスが鍵だと締めくくった。