Show HN:歐洲能否利用現有計算資源訓練前沿AI模型?
該研究模型顯示,透過整合歐洲現有的公共AI計算資源(如EuroHPC超級計算機和國家AI工廠),歐洲可以在2028年左右訓練出前沿級AI模型,而新建千兆瓦資料中心則需到2033年。聯邦式低通訊訓練(DiLoCo風格)是關鍵技術。
近日,一個名為“euromesh”的開源專案在Hacker News上引發關注。該專案透過建模分析,回答了一個關鍵問題:歐洲能否利用自身已擁有的公共計算資源,在等待新建千兆瓦資料中心接入電網的漫長過程中,訓練出主權前沿AI模型?答案是肯定的,但只是權宜之計。
研究指出,歐洲目前透過EuroHPC超級計算機和國家AI工廠運營著數十艾級浮點運算(exaflops)的公共AI算力。相比之下,新建一個1千兆瓦(GW)的資料中心平均需要7.6年才能接入電網。透過採用低通訊量的聯邦式訓練(如DiLoCo風格),歐洲現有算力有望在2028年左右訓練出前沿級模型,而等待新建千兆瓦資料中心則要到2033年。
該專案包含一個三層模型:第一層評估低通訊訓練的效率(即DiLoCo帶來的額外計算成本);第二層計算各站點投入使用的時機和累計算力的增長;第三層從時間、成本、碳排放和可行性四個維度對每個區域進行評分。最終結果幾乎完全由第二層決定:聯邦方案的勝出條件是它的站點在千兆瓦資料中心建成之前上線。訓練效率的影響是次要的,這一點透過敏感性分析得到了確認。
研究資料來源包括電網接入時間(七個區域,引用AWS“最長七年”及IEA“2至10年”範圍)和歐洲公共計算資源清單(EuroHPC旗艦機及19個AI工廠的加速器數量和訓練時間)。模型引數附有置信度標籤,並公開了所有原始碼和測試用例(52項測試全部透過)。
值得一提的是,專案作者坦承了局限性:電網接入時間基於中央估計而非實際觀測(歐洲尚未有運營商成功接入1GW點負荷);EuroHPC機器是共享、分批排程且異構的,實際可用算力取決於政治決策而非硬體事實;前沿規模的分散式訓練在超過100億引數時尚未得到驗證。因此,目標是一個可信的前沿級模型,而非保證達到4050億引數。所有資料和結論截至2026年6月,且不經過同行評審。
該專案展示了歐洲在AI主權方面的另一種可能路徑:不依賴鉅額資本支出,而是透過聯邦化現有資源加速實現。雖然挑戰重重,但其開放性和透明度為政策討論提供了有價值的參考。