AI News HubLIVE
站内改写2 分鐘閱讀

輸出最大化教授 — Anjney Midha、AMP

Anjney Midha 探討了 AI 算力浪費問題,強調了節點利用率、模型 FLOPs 利用率(MFU)等指標的重要性,並介紹了 AMP 構建計算網格的願景,旨在像輸送電力一樣高效調配 FLOPs。他主張負責任的基礎設施建設、社區參與激勵,以及迭代式擴展而非倉促部署,並指出前沿 AI 的瓶頸更多在於系統效率而非 GPU 數量。

在最新一期的播客中,swyx 與 AMP 創始人兼 CEO Anjney Midha 深入探討了 AI 算力浪費的根源與解決方案。Anjney 指出,當前 AI 領域的 GPU 競賽往往忽視了系統效率這一核心問題。他以 xAI 為例,其模型 FLOPs 利用率(MFU)低於 10%,而業界最佳水平已接近 60-70%,甚至谷歌內部將節點利用率低於 95% 視為故障。這種低效並非源於技術無能,而是資金投入與執行層面之間的“對齊”問題——從資本到集羣管理的鏈條過長,導致初始設計的小偏差在規模化時被急劇放大。

Anjney 認為,AI 基礎設施的擴展必須摒棄“快速行動,打破常規”的創業心態,轉向“快速行動,負責的基礎設施”模式。他引用 Facebook 從“move fast and break things”到“move fast with stable infrastructure”的轉變,強調 AI 時代更需常識與穩健。尤其是數據中心建設面臨日益嚴峻的社區抵制,據估算美國多達 20% 的新數據中心項目可能因社區反對而擱淺。為此,他提出一種創新激勵方案:每 GPU 小時加收 0.5 美元直接返還給當地社區,以換取公眾支持。這種“合作而非對抗”的思路,既能保障算力供應,又能緩解電網和環境壓力。

AMP 的核心願景是構建一個獨立、高效的算力網格,讓 FLOPs 像電力一樣自由流動。受電網獨立系統運營商(ISO)模式啓發,AMP 計劃通過動態優先級調度和可中斷需求管理,將閒置算力合理分配給不同任務。Anjney 透露,AMP 的目標是部署 1.2GW 的基礎負載,並具備 6GW 的峯值調度能力,這需要與擁有 20 年以上經驗的數據中心運營商合作,而非追求“新潮”品牌。此外,他批評了 DeepMind 等機構未公開的研究成果導致負外部性,呼籲更開放的知識共享。

在談及 Anthropic 的成功時,Anjney 將其歸因於從首日起就將“編程”作為最高優先級的明確專注,以及早期資金相對稀缺帶來的紀律性。他認為,過度的資本過早注入反而會使 AI 實驗室變得脆弱。對於研究員轉型 CEO 的現象,Anjney 表示風險投資往往低估了科學家的管理潛力,優秀的 CEO 需要具備在多個層級上進行對抗性溝通的能力。

最後,Anjney 強調,前沿 AI 的競爭不在於“贏”,而在於“引領”。真正的突破需要將物理學約束與現實技術結合,而硅谷既有傳教士般的使命感,也不乏僱傭兵式的逐利行為——關鍵在於如何平衡兩者。