2026-06-18站内改写2 分鐘閱讀更新: 2026-06-19

輸出最大化教授 — Anjney Midha、AMP

Anjney Midha 探討了 AI 算力浪費問題，強調了節點利用率、模型 FLOPs 利用率（MFU）等指標的重要性，並介紹了 AMP 構建計算網格的願景，旨在像輸送電力一樣高效調配 FLOPs。他主張負責任的基礎設施建設、社群參與激勵，以及迭代式擴充套件而非倉促部署，並指出前沿 AI 的瓶頸更多在於系統效率而非 GPU 數量。

來源Latent Space

在最新一期的播客中，swyx 與 AMP 創始人兼 CEO Anjney Midha 深入探討了 AI 算力浪費的根源與解決方案。Anjney 指出，當前 AI 領域的 GPU 競賽往往忽視了系統效率這一核心問題。他以 xAI 為例，其模型 FLOPs 利用率（MFU）低於 10%，而業界最佳水平已接近 60-70%，甚至谷歌內部將節點利用率低於 95% 視為故障。這種低效並非源於技術無能，而是資金投入與執行層面之間的“對齊”問題——從資本到叢集管理的鏈條過長，導致初始設計的小偏差在規模化時被急劇放大。

Anjney 認為，AI 基礎設施的擴充套件必須摒棄“快速行動，打破常規”的創業心態，轉向“快速行動，負責的基礎設施”模式。他引用 Facebook 從“move fast and break things”到“move fast with stable infrastructure”的轉變，強調 AI 時代更需常識與穩健。尤其是資料中心建設面臨日益嚴峻的社群抵制，據估算美國多達 20% 的新資料中心專案可能因社群反對而擱淺。為此，他提出一種創新激勵方案：每 GPU 小時加收 0.5 美元直接返還給當地社群，以換取公眾支援。這種“合作而非對抗”的思路，既能保障算力供應，又能緩解電網和環境壓力。

AMP 的核心願景是構建一個獨立、高效的算力網格，讓 FLOPs 像電力一樣自由流動。受電網獨立系統運營商（ISO）模式啟發，AMP 計劃透過動態優先順序排程和可中斷需求管理，將閒置算力合理分配給不同任務。Anjney 透露，AMP 的目標是部署 1.2GW 的基礎負載，並具備 6GW 的峰值排程能力，這需要與擁有 20 年以上經驗的資料中心運營商合作，而非追求“新潮”品牌。此外，他批評了 DeepMind 等機構未公開的研究成果導致負外部性，呼籲更開放的知識共享。

在談及 Anthropic 的成功時，Anjney 將其歸因於從首日起就將“程式設計”作為最高優先順序的明確專注，以及早期資金相對稀缺帶來的紀律性。他認為，過度的資本過早注入反而會使 AI 實驗室變得脆弱。對於研究員轉型 CEO 的現象，Anjney 表示風險投資往往低估了科學家的管理潛力，優秀的 CEO 需要具備在多個層級上進行對抗性溝通的能力。

最後，Anjney 強調，前沿 AI 的競爭不在於“贏”，而在於“引領”。真正的突破需要將物理學約束與現實技術結合，而矽谷既有傳教士般的使命感，也不乏僱傭兵式的逐利行為——關鍵在於如何平衡兩者。