AI News HubLIVE
站內改寫2 分鐘閱讀

GPU和記憶體短缺,但AI真正的瓶頸是電工

文章指出,儘管GPU和記憶體供應緊張,但AI資料中心擴張的真正瓶頸是電工短缺。以TeraWulf在安大略湖邊的Lake Mariner站點為例,展示了從比特幣挖礦轉向AI/HPC所需的巨大電力和基礎設施規模,以及建設過程中面臨的挑戰。

來源Hacker News AI作者: Gooblebrai

儘管GPU和記憶體的供應緊張已成為AI行業的熱門話題,但根據最新報道,真正的瓶頸或許是電工的短缺。以TeraWulf公司位於紐約州布法羅附近安大略湖畔的Lake Mariner站點為例,這一觀點得到了充分印證。

該站點最初是一個燃煤發電廠,2022年中期TeraWulf宣佈啟動50兆瓦的比特幣挖礦能力,並在18個月內完成。隨後,經過一個2兆瓦的AI/GPU試點,公司於2025年全面轉向HPC/AI業務,將站點佔地面積擴充套件至157英畝,並計劃將容量提升至750兆瓦。儘管仍會基於機會進行比特幣挖礦,但管理層顯然認為提供AI基礎設施是更有利可圖的商業模式。

The Next Platform與施耐德電氣一同參觀了該站點。施耐德提供了大部分電氣基礎設施,其子公司Motivair則提供了液冷技術,這對AI級資料中心至關重要。TeraWulf的初始HPC/AI專案是CB-1資料中心,容量20兆瓦,而50兆瓦的CB-2計劃於2025年上線。主權AI專家Core42成為首家客戶,已在CB-1執行AMD系統達十個月。AI基礎設施公司Fluidstack(谷歌支援,幫助Anthropic部署TPU系統)也在CB-3投入生產。

最引人注目的是CB-4建築,佔地33萬平方英尺,容量200兆瓦,包含四個資料大廳,每個面積3.3萬平方英尺。該建築於1月開工,預計夏末通電。COO肖恩·法雷爾表示,大廳採用混凝土地板,可支撐每機架8000磅的負載,未來可達1萬磅,遠超傳統高架地板的承重能力。非計算機械室佔據了總建築面積的一半以上,處理閉環冷卻系統,透過屋頂冷卻塔散熱,且不使用水,冷卻液壽命長達10至15年。

TeraWulf已向施耐德和Motivair投資2.9億美元,用於UPS、電池、CDU、機架等裝置。相鄰的CB-5建築同樣巨大,4月1日開工,屋頂已安裝,預計年底通電。Fluidstack已簽約160兆瓦容量。

值得注意的是,該站點沒有柴油發電機作為備用電源,而是依賴雙345千伏電源線路,因此具有Tier 3等效性。電網電源89%為零碳,主要來自尼亞加拉瀑布的水電。法雷爾強調,電力供應是資料中心開發的硬性要求,但連線性已不那麼嚴格:訓練任務對延遲要求較低,且如今建設連線更容易。Lake Mariner距布法羅比爾的體育場約一小時車程,該體育場的翻新釋放了數百名電工,而電工正是當前資料中心專案最大的瓶頸。

建設現場24小時運轉,通常有1800名技工,其中650至800名是電工。比特幣挖礦的建設成本約為每兆瓦50萬美元,而AI/HPC基礎設施成本高達每兆瓦700萬至1000萬美元,主要是由於液冷等複雜技術。作為託管站點,客戶將自行安裝和管理計算裝置。美國資料中心平均租金約為每千瓦每月140美元,合同期10至15年。