AI News HubLIVE
站內改寫2 分鐘閱讀

Meta超級智能:領導力計算、人才與數據

Meta以約300億美元估值收購Scale AI 49%股份,顯示其資金充裕。儘管資源雄厚,Meta在模型性能上落後於基礎實驗室。Zuckerberg親自領導新“超級智能”團隊,以鉅額薪酬挖角頂級人才,並徹底改革數據中心策略,採用帳篷式快速建設。同時,Llama 4因注意力機制、數據質量等問題遭遇失敗,但Meta正通過收購和挖角彌補人才差距。

來源SemiAnalysis作者: Dylan Patel

Meta近期以約300億美元估值收購Scale AI 49%股份,這一消息震驚業界,顯示這家年現金流超過1000億美元的廣告巨頭在資金上毫無顧慮。然而,儘管資源雄厚,Meta在模型性能上一直落後於OpenAI等前沿實驗室。真正的警鐘是Meta在開源模型領域的領先地位被中國的DeepSeek奪走。這促使首席執行官馬克·扎克伯格進入“創始人模式”,親自領導Meta的AI轉型,並識別出兩大核心短板:人才和算力。

扎克伯格不僅投入鉅額資金,還從根本上重新思考Meta的生成式AI戰略。他正在從零開始組建一個名為“超級智能”的新團隊,並親自挖角頂尖AI人才,提供高達四年2億美元甚至10億美元的薪酬方案,遠超同行。這種做法不僅直接吸引了頂尖人才,還大幅提高了競爭對手的用人成本,從而削弱其競爭力。

在數據中心方面,扎克伯格拋棄了原有的計劃,轉而採用“帳篷式”快速建設方案,優先考慮速度而非冗餘。Meta正在俄亥俄州建設名為“Prometheus”的1GW級AI訓練集羣,採用“多管齊下”的基礎設施策略:包括自建園區、向第三方租賃、AI優化設計、多數據中心園區訓練以及現場天然氣發電。該集羣使用Arista 7808交換機和Broadcom Jericho/Ramon ASIC構建超高速後端網絡。噹噹地電網無法滿足需求時,Meta甚至自行建設兩座200MW的天然氣發電廠,其設備包括Solar Turbines Titan 250燃氣輪機、PGM 130燃氣輪機、西門子能源SGT400燃氣輪機和CAT 3520往復式發動機。

此外,路易斯安那州的“Hyperion”集羣目標達到2GW,將成為全球最大的單體園區,一期IT功率超過1.5GW,計劃在2027年底完工。Hyperion旨在縮小與OpenAI在計算能力上的差距。Meta還在建設其他多個數據中心,全部詳情可在其數據中心行業模型中查閲。

然而,Meta的Llama 4模型遭遇了重大失敗。技術上,分塊注意力機制導致長距離推理困難,因為每個塊的第一個token無法訪問先前上下文,雖然有全局注意力層,但仍不足以支持鏈式推理。專家選擇路由在訓練和推理中存在缺陷,雖然保證了專家負載均衡,但某些熱門token可能被多個專家處理,導致泛化能力下降,且推理時專家只能從少量token中選擇,影響效果。Meta在訓練中途從專家選擇切換回token選擇,但性能下降嚴重。數據質量方面,Meta中途轉向內部爬蟲,但清理和去重流程未經過大規模測試,且未使用YouTube數據(其他實驗室如OpenAI和DeepSeek都使用),這可能影響了多模態模型的訓練。此外,擴展實驗管理不善,存在相互競爭的研究方向,缺乏統一領導,某些架構選擇未經充分消融實驗就直接採用。

儘管如此,Meta仍通過蒸餾技術將Llama 4的部分能力注入到較小的Maverick和Scout模型中,但這些模型仍受源模型限制,並非同尺寸最佳。

為了彌補人才和技術差距,扎克伯格親自招募頂尖研究員,並收購了Scale AI,引入了前GitHub CEO Nat Friedman、前Scale AI CEO Alex Wang以及SSI的Daniel Gross。Scale AI的SEAL實驗室專注於評估,開發了HLE基準,對Meta至關重要。這些舉措旨在建立人才聚集的飛輪效應,結合無與倫比的算力和超過20億日活用户,推動Meta在超級智能領域的競爭。

此外,美國政府的“一項美麗法案”(One Big Beautiful Bill)中針對超大規模數據中心的税收優惠進一步激勵了Meta的鉅額投資。扎克伯格選擇了最佳時機啓動這一支出狂潮,聯邦政府資助的超級智能項目被視為現代的曼哈頓計劃。

總之,Meta正在經歷從計算到人才的全面重塑,儘管Llama 4失敗,但其訓練算力快速增長,預計將與OpenAI匹敵。扎克伯格的領導和戰略調整可能使Meta在未來幾年內重新奪回AI領域的領先地位。