AI News HubLIVE
站内改写2 分钟阅读

输出最大化教授 — Anjney Midha、AMP

Anjney Midha 探讨了 AI 算力浪费问题,强调了节点利用率、模型 FLOPs 利用率(MFU)等指标的重要性,并介绍了 AMP 构建计算网格的愿景,旨在像输送电力一样高效调配 FLOPs。他主张负责任的基础设施建设、社区参与激励,以及迭代式扩展而非仓促部署,并指出前沿 AI 的瓶颈更多在于系统效率而非 GPU 数量。

在最新一期的播客中,swyx 与 AMP 创始人兼 CEO Anjney Midha 深入探讨了 AI 算力浪费的根源与解决方案。Anjney 指出,当前 AI 领域的 GPU 竞赛往往忽视了系统效率这一核心问题。他以 xAI 为例,其模型 FLOPs 利用率(MFU)低于 10%,而业界最佳水平已接近 60-70%,甚至谷歌内部将节点利用率低于 95% 视为故障。这种低效并非源于技术无能,而是资金投入与执行层面之间的“对齐”问题——从资本到集群管理的链条过长,导致初始设计的小偏差在规模化时被急剧放大。

Anjney 认为,AI 基础设施的扩展必须摒弃“快速行动,打破常规”的创业心态,转向“快速行动,负责的基础设施”模式。他引用 Facebook 从“move fast and break things”到“move fast with stable infrastructure”的转变,强调 AI 时代更需常识与稳健。尤其是数据中心建设面临日益严峻的社区抵制,据估算美国多达 20% 的新数据中心项目可能因社区反对而搁浅。为此,他提出一种创新激励方案:每 GPU 小时加收 0.5 美元直接返还给当地社区,以换取公众支持。这种“合作而非对抗”的思路,既能保障算力供应,又能缓解电网和环境压力。

AMP 的核心愿景是构建一个独立、高效的算力网格,让 FLOPs 像电力一样自由流动。受电网独立系统运营商(ISO)模式启发,AMP 计划通过动态优先级调度和可中断需求管理,将闲置算力合理分配给不同任务。Anjney 透露,AMP 的目标是部署 1.2GW 的基础负载,并具备 6GW 的峰值调度能力,这需要与拥有 20 年以上经验的数据中心运营商合作,而非追求“新潮”品牌。此外,他批评了 DeepMind 等机构未公开的研究成果导致负外部性,呼吁更开放的知识共享。

在谈及 Anthropic 的成功时,Anjney 将其归因于从首日起就将“编程”作为最高优先级的明确专注,以及早期资金相对稀缺带来的纪律性。他认为,过度的资本过早注入反而会使 AI 实验室变得脆弱。对于研究员转型 CEO 的现象,Anjney 表示风险投资往往低估了科学家的管理潜力,优秀的 CEO 需要具备在多个层级上进行对抗性沟通的能力。

最后,Anjney 强调,前沿 AI 的竞争不在于“赢”,而在于“引领”。真正的突破需要将物理学约束与现实技术结合,而硅谷既有传教士般的使命感,也不乏雇佣兵式的逐利行为——关键在于如何平衡两者。