輸出最大化教授 — Anjney Midha、AMP
Anjney Midha 探討了 AI 算力浪費問題,強調了節點利用率、模型 FLOPs 利用率(MFU)等指標的重要性,並介紹了 AMP 構建計算網格的願景,旨在像輸送電力一樣高效調配 FLOPs。他主張負責任的基礎設施建設、社群參與激勵,以及迭代式擴充套件而非倉促部署,並指出前沿 AI 的瓶頸更多在於系統效率而非 GPU 數量。
在最新一期的播客中,swyx 與 AMP 創始人兼 CEO Anjney Midha 深入探討了 AI 算力浪費的根源與解決方案。Anjney 指出,當前 AI 領域的 GPU 競賽往往忽視了系統效率這一核心問題。他以 xAI 為例,其模型 FLOPs 利用率(MFU)低於 10%,而業界最佳水平已接近 60-70%,甚至谷歌內部將節點利用率低於 95% 視為故障。這種低效並非源於技術無能,而是資金投入與執行層面之間的“對齊”問題——從資本到叢集管理的鏈條過長,導致初始設計的小偏差在規模化時被急劇放大。
Anjney 認為,AI 基礎設施的擴充套件必須摒棄“快速行動,打破常規”的創業心態,轉向“快速行動,負責的基礎設施”模式。他引用 Facebook 從“move fast and break things”到“move fast with stable infrastructure”的轉變,強調 AI 時代更需常識與穩健。尤其是資料中心建設面臨日益嚴峻的社群抵制,據估算美國多達 20% 的新資料中心專案可能因社群反對而擱淺。為此,他提出一種創新激勵方案:每 GPU 小時加收 0.5 美元直接返還給當地社群,以換取公眾支援。這種“合作而非對抗”的思路,既能保障算力供應,又能緩解電網和環境壓力。
AMP 的核心願景是構建一個獨立、高效的算力網格,讓 FLOPs 像電力一樣自由流動。受電網獨立系統運營商(ISO)模式啟發,AMP 計劃透過動態優先順序排程和可中斷需求管理,將閒置算力合理分配給不同任務。Anjney 透露,AMP 的目標是部署 1.2GW 的基礎負載,並具備 6GW 的峰值排程能力,這需要與擁有 20 年以上經驗的資料中心運營商合作,而非追求“新潮”品牌。此外,他批評了 DeepMind 等機構未公開的研究成果導致負外部性,呼籲更開放的知識共享。
在談及 Anthropic 的成功時,Anjney 將其歸因於從首日起就將“程式設計”作為最高優先順序的明確專注,以及早期資金相對稀缺帶來的紀律性。他認為,過度的資本過早注入反而會使 AI 實驗室變得脆弱。對於研究員轉型 CEO 的現象,Anjney 表示風險投資往往低估了科學家的管理潛力,優秀的 CEO 需要具備在多個層級上進行對抗性溝通的能力。
最後,Anjney 強調,前沿 AI 的競爭不在於“贏”,而在於“引領”。真正的突破需要將物理學約束與現實技術結合,而矽谷既有傳教士般的使命感,也不乏僱傭兵式的逐利行為——關鍵在於如何平衡兩者。