GLM-5.2:開放代理的階躍性變革
GLM-5.2 是 Z.ai 釋出的最新開放權重模型,被廣泛視為開放模型領域的一次重大突破。該模型在編碼和代理任務上表現出色,效能可與 Anthropic 和 OpenAI 的頂尖模型相媲美,甚至在某些基準測試中超越了它們。其釋出恰逢美國對 Claude Fable 實施出口限制,引發了關於開放模型與封閉模型未來格局的討論。
幾周前,當 AI 世界仍因 Claude Fable 5 的出口限制和實際禁令而震驚時,Z.ai 釋出了其最新模型 GLM-5.2。該模型於 6 月 13 日週六異常地向 GLM 編碼計劃成員推出,這通常意味著某種不尋常的原因。Z.ai 似乎是想利用 Anthropic 在 AI 研究人員中實施靜默保障措施所引發的“反開放科學”情緒。
GLM-5.2 的命名看似增量更新,但實際上它代表了開放模型能力的一次階躍性變化。在社群基準測試中,GLM-5.2 在 Arena 的代理排行榜上成為唯一能與 OpenAI 和 Anthropic 最新模型競爭的開放模型,甚至在設計方面擊敗了 Claude Fable 本身。
大多數受人尊敬的 AI 評論家和研究人員在親自使用後都稱讚該模型。這種社群討論的焦點在開放模型釋出中只出現過一次——DeepSeek R1。GLM-5.2 的進步更像是一條單向門,推動 AI 的進步。Anthropic 憑藉 Claude Code 實現了創紀錄的收入增長率,而 GLM-5.2 是第一個提供可信替代方案的開放模型。
關鍵點在於,GLM-5.2 是第一個在編碼框架中感覺正確的開放權重模型。作者親自測試後認為,模型能力立即就緒,儘管存在一些小的瑕疵,比如 Claude Code 嘗試向模型傳送影像會破壞 Fireworks API。
這一發布將產生廣泛影響。首先,它驗證了開放模型追趕封閉模型的時間差約為 6-9 個月的觀點。隨著美國實驗室大幅增加計算量,原本預計效能差距會擴大,但 GLM-5.2 的出現打破了這一預期。這給 Anthropic 等封閉實驗室帶來了定價壓力,並推動了開放模型推理提供商的發展。
更深遠的影響在於監管和控制。GLM-5.2 的釋出將被永久地與 Claude Fable 和 Claude Mythos 關聯起來。當前,美國政府認為 Mythos 級模型能力不安全,而中國模型製造商卻在推進對所有人可用開放能力的開發。如果開放模型被禁止,而只有封閉模型在兩年內獲得 10 倍或 100 倍的效能提升,我們將面臨更大的問題。
需要更多人來設想並向決策者傳達如何管理日益強大的開放模型。隨著輝達下一代晶片已投產和演算法不斷進步,AI 進步的道路還很漫長。開放模型倡導者需要找到一條狹窄的路徑,以確保效能的巨大飛躍不僅僅屬於封閉模型。