2025-07-12 04:12 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

Meta超級智能：領導力計算、人才與數據

Meta以約300億美元估值收購Scale AI 49%股份，顯示其資金充裕。儘管資源雄厚，Meta在模型性能上落後於基礎實驗室。Zuckerberg親自領導新“超級智能”團隊，以鉅額薪酬挖角頂級人才，並徹底改革數據中心策略，採用帳篷式快速建設。同時，Llama 4因注意力機制、數據質量等問題遭遇失敗，但Meta正通過收購和挖角彌補人才差距。

來源SemiAnalysis作者: Dylan Patel

Meta近期以約300億美元估值收購Scale AI 49%股份，這一消息震驚業界，顯示這家年現金流超過1000億美元的廣告巨頭在資金上毫無顧慮。然而，儘管資源雄厚，Meta在模型性能上一直落後於OpenAI等前沿實驗室。真正的警鐘是Meta在開源模型領域的領先地位被中國的DeepSeek奪走。這促使首席執行官馬克·扎克伯格進入“創始人模式”，親自領導Meta的AI轉型，並識別出兩大核心短板：人才和算力。

扎克伯格不僅投入鉅額資金，還從根本上重新思考Meta的生成式AI戰略。他正在從零開始組建一個名為“超級智能”的新團隊，並親自挖角頂尖AI人才，提供高達四年2億美元甚至10億美元的薪酬方案，遠超同行。這種做法不僅直接吸引了頂尖人才，還大幅提高了競爭對手的用人成本，從而削弱其競爭力。

在數據中心方面，扎克伯格拋棄了原有的計劃，轉而採用“帳篷式”快速建設方案，優先考慮速度而非冗餘。Meta正在俄亥俄州建設名為“Prometheus”的1GW級AI訓練集羣，採用“多管齊下”的基礎設施策略：包括自建園區、向第三方租賃、AI優化設計、多數據中心園區訓練以及現場天然氣發電。該集羣使用Arista 7808交換機和Broadcom Jericho/Ramon ASIC構建超高速後端網絡。噹噹地電網無法滿足需求時，Meta甚至自行建設兩座200MW的天然氣發電廠，其設備包括Solar Turbines Titan 250燃氣輪機、PGM 130燃氣輪機、西門子能源SGT400燃氣輪機和CAT 3520往復式發動機。

此外，路易斯安那州的“Hyperion”集羣目標達到2GW，將成為全球最大的單體園區，一期IT功率超過1.5GW，計劃在2027年底完工。Hyperion旨在縮小與OpenAI在計算能力上的差距。Meta還在建設其他多個數據中心，全部詳情可在其數據中心行業模型中查閲。

然而，Meta的Llama 4模型遭遇了重大失敗。技術上，分塊注意力機制導致長距離推理困難，因為每個塊的第一個token無法訪問先前上下文，雖然有全局注意力層，但仍不足以支持鏈式推理。專家選擇路由在訓練和推理中存在缺陷，雖然保證了專家負載均衡，但某些熱門token可能被多個專家處理，導致泛化能力下降，且推理時專家只能從少量token中選擇，影響效果。Meta在訓練中途從專家選擇切換回token選擇，但性能下降嚴重。數據質量方面，Meta中途轉向內部爬蟲，但清理和去重流程未經過大規模測試，且未使用YouTube數據（其他實驗室如OpenAI和DeepSeek都使用），這可能影響了多模態模型的訓練。此外，擴展實驗管理不善，存在相互競爭的研究方向，缺乏統一領導，某些架構選擇未經充分消融實驗就直接採用。

儘管如此，Meta仍通過蒸餾技術將Llama 4的部分能力注入到較小的Maverick和Scout模型中，但這些模型仍受源模型限制，並非同尺寸最佳。

為了彌補人才和技術差距，扎克伯格親自招募頂尖研究員，並收購了Scale AI，引入了前GitHub CEO Nat Friedman、前Scale AI CEO Alex Wang以及SSI的Daniel Gross。Scale AI的SEAL實驗室專注於評估，開發了HLE基準，對Meta至關重要。這些舉措旨在建立人才聚集的飛輪效應，結合無與倫比的算力和超過20億日活用户，推動Meta在超級智能領域的競爭。

此外，美國政府的“一項美麗法案”（One Big Beautiful Bill）中針對超大規模數據中心的税收優惠進一步激勵了Meta的鉅額投資。扎克伯格選擇了最佳時機啓動這一支出狂潮，聯邦政府資助的超級智能項目被視為現代的曼哈頓計劃。

總之，Meta正在經歷從計算到人才的全面重塑，儘管Llama 4失敗，但其訓練算力快速增長，預計將與OpenAI匹敵。扎克伯格的領導和戰略調整可能使Meta在未來幾年內重新奪回AI領域的領先地位。