GPU和内存短缺,但AI真正的瓶颈是电工
文章指出,尽管GPU和内存供应紧张,但AI数据中心扩张的真正瓶颈是电工短缺。以TeraWulf在安大略湖边的Lake Mariner站点为例,展示了从比特币挖矿转向AI/HPC所需的巨大电力和基础设施规模,以及建设过程中面临的挑战。
尽管GPU和内存的供应紧张已成为AI行业的热门话题,但根据最新报道,真正的瓶颈或许是电工的短缺。以TeraWulf公司位于纽约州布法罗附近安大略湖畔的Lake Mariner站点为例,这一观点得到了充分印证。
该站点最初是一个燃煤发电厂,2022年中期TeraWulf宣布启动50兆瓦的比特币挖矿能力,并在18个月内完成。随后,经过一个2兆瓦的AI/GPU试点,公司于2025年全面转向HPC/AI业务,将站点占地面积扩展至157英亩,并计划将容量提升至750兆瓦。尽管仍会基于机会进行比特币挖矿,但管理层显然认为提供AI基础设施是更有利可图的商业模式。
The Next Platform与施耐德电气一同参观了该站点。施耐德提供了大部分电气基础设施,其子公司Motivair则提供了液冷技术,这对AI级数据中心至关重要。TeraWulf的初始HPC/AI项目是CB-1数据中心,容量20兆瓦,而50兆瓦的CB-2计划于2025年上线。主权AI专家Core42成为首家客户,已在CB-1运行AMD系统达十个月。AI基础设施公司Fluidstack(谷歌支持,帮助Anthropic部署TPU系统)也在CB-3投入生产。
最引人注目的是CB-4建筑,占地33万平方英尺,容量200兆瓦,包含四个数据大厅,每个面积3.3万平方英尺。该建筑于1月开工,预计夏末通电。COO肖恩·法雷尔表示,大厅采用混凝土地板,可支撑每机架8000磅的负载,未来可达1万磅,远超传统高架地板的承重能力。非计算机械室占据了总建筑面积的一半以上,处理闭环冷却系统,通过屋顶冷却塔散热,且不使用水,冷却液寿命长达10至15年。
TeraWulf已向施耐德和Motivair投资2.9亿美元,用于UPS、电池、CDU、机架等设备。相邻的CB-5建筑同样巨大,4月1日开工,屋顶已安装,预计年底通电。Fluidstack已签约160兆瓦容量。
值得注意的是,该站点没有柴油发电机作为备用电源,而是依赖双345千伏电源线路,因此具有Tier 3等效性。电网电源89%为零碳,主要来自尼亚加拉瀑布的水电。法雷尔强调,电力供应是数据中心开发的硬性要求,但连接性已不那么严格:训练任务对延迟要求较低,且如今建设连接更容易。Lake Mariner距布法罗比尔的体育场约一小时车程,该体育场的翻新释放了数百名电工,而电工正是当前数据中心项目最大的瓶颈。
建设现场24小时运转,通常有1800名技工,其中650至800名是电工。比特币挖矿的建设成本约为每兆瓦50万美元,而AI/HPC基础设施成本高达每兆瓦700万至1000万美元,主要是由于液冷等复杂技术。作为托管站点,客户将自行安装和管理计算设备。美国数据中心平均租金约为每千瓦每月140美元,合同期10至15年。