2026-06-22 22:52 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-23 09:42 UTC+8

GLM-5.2：開放代理的階躍性變革

GLM-5.2 是 Z.ai 釋出的最新開放權重模型，被廣泛視為開放模型領域的一次重大突破。該模型在編碼和代理任務上表現出色，效能可與 Anthropic 和 OpenAI 的頂尖模型相媲美，甚至在某些基準測試中超越了它們。其釋出恰逢美國對 Claude Fable 實施出口限制，引發了關於開放模型與封閉模型未來格局的討論。

來源Interconnects (Nathan Lambert)作者: Nathan Lambert

幾周前，當 AI 世界仍因 Claude Fable 5 的出口限制和實際禁令而震驚時，Z.ai 釋出了其最新模型 GLM-5.2。該模型於 6 月 13 日週六異常地向 GLM 編碼計劃成員推出，這通常意味著某種不尋常的原因。Z.ai 似乎是想利用 Anthropic 在 AI 研究人員中實施靜默保障措施所引發的“反開放科學”情緒。

GLM-5.2 的命名看似增量更新，但實際上它代表了開放模型能力的一次階躍性變化。在社群基準測試中，GLM-5.2 在 Arena 的代理排行榜上成為唯一能與 OpenAI 和 Anthropic 最新模型競爭的開放模型，甚至在設計方面擊敗了 Claude Fable 本身。

大多數受人尊敬的 AI 評論家和研究人員在親自使用後都稱讚該模型。這種社群討論的焦點在開放模型釋出中只出現過一次——DeepSeek R1。GLM-5.2 的進步更像是一條單向門，推動 AI 的進步。Anthropic 憑藉 Claude Code 實現了創紀錄的收入增長率，而 GLM-5.2 是第一個提供可信替代方案的開放模型。

關鍵點在於，GLM-5.2 是第一個在編碼框架中感覺正確的開放權重模型。作者親自測試後認為，模型能力立即就緒，儘管存在一些小的瑕疵，比如 Claude Code 嘗試向模型傳送影像會破壞 Fireworks API。

這一發布將產生廣泛影響。首先，它驗證了開放模型追趕封閉模型的時間差約為 6-9 個月的觀點。隨著美國實驗室大幅增加計算量，原本預計效能差距會擴大，但 GLM-5.2 的出現打破了這一預期。這給 Anthropic 等封閉實驗室帶來了定價壓力，並推動了開放模型推理提供商的發展。

更深遠的影響在於監管和控制。GLM-5.2 的釋出將被永久地與 Claude Fable 和 Claude Mythos 關聯起來。當前，美國政府認為 Mythos 級模型能力不安全，而中國模型製造商卻在推進對所有人可用開放能力的開發。如果開放模型被禁止，而只有封閉模型在兩年內獲得 10 倍或 100 倍的效能提升，我們將面臨更大的問題。

需要更多人來設想並向決策者傳達如何管理日益強大的開放模型。隨著輝達下一代晶片已投產和演算法不斷進步，AI 進步的道路還很漫長。開放模型倡導者需要找到一條狹窄的路徑，以確保效能的巨大飛躍不僅僅屬於封閉模型。