Show HN:歐洲能否利用現有計算資源訓練前沿AI模型?
該研究模型顯示,通過整合歐洲現有的公共AI計算資源(如EuroHPC超級計算機和國家AI工廠),歐洲可以在2028年左右訓練出前沿級AI模型,而新建千兆瓦數據中心則需到2033年。聯邦式低通信訓練(DiLoCo風格)是關鍵技術。
近日,一個名為“euromesh”的開源項目在Hacker News上引發關注。該項目通過建模分析,回答了一個關鍵問題:歐洲能否利用自身已擁有的公共計算資源,在等待新建千兆瓦數據中心接入電網的漫長過程中,訓練出主權前沿AI模型?答案是肯定的,但只是權宜之計。
研究指出,歐洲目前通過EuroHPC超級計算機和國家AI工廠運營着數十艾級浮點運算(exaflops)的公共AI算力。相比之下,新建一個1千兆瓦(GW)的數據中心平均需要7.6年才能接入電網。通過採用低通信量的聯邦式訓練(如DiLoCo風格),歐洲現有算力有望在2028年左右訓練出前沿級模型,而等待新建千兆瓦數據中心則要到2033年。
該項目包含一個三層模型:第一層評估低通信訓練的效率(即DiLoCo帶來的額外計算成本);第二層計算各站點投入使用的時機和累計算力的增長;第三層從時間、成本、碳排放和可行性四個維度對每個區域進行評分。最終結果幾乎完全由第二層決定:聯邦方案的勝出條件是它的站點在千兆瓦數據中心建成之前上線。訓練效率的影響是次要的,這一點通過敏感性分析得到了確認。
研究數據來源包括電網接入時間(七個區域,引用AWS“最長七年”及IEA“2至10年”範圍)和歐洲公共計算資源清單(EuroHPC旗艦機及19個AI工廠的加速器數量和訓練時間)。模型參數附有置信度標籤,並公開了所有源代碼和測試用例(52項測試全部通過)。
值得一提的是,項目作者坦承了局限性:電網接入時間基於中央估計而非實際觀測(歐洲尚未有運營商成功接入1GW點負荷);EuroHPC機器是共享、分批調度且異構的,實際可用算力取決於政治決策而非硬件事實;前沿規模的分佈式訓練在超過100億參數時尚未得到驗證。因此,目標是一個可信的前沿級模型,而非保證達到4050億參數。所有數據和結論截至2026年6月,且不經過同行評審。
該項目展示了歐洲在AI主權方面的另一種可能路徑:不依賴鉅額資本支出,而是通過聯邦化現有資源加速實現。雖然挑戰重重,但其開放性和透明度為政策討論提供了有價值的參考。