2026-06-17站内改写2 分鐘閱讀更新: 2026-06-18

GLM-5.2 可能是最強大的純文本開放權重LLM

中國AI實驗室Z.ai發佈了GLM-5.2，這是一個擁有753B參數、1M token上下文窗口的混合專家模型，採用MIT許可證。它在開放權重模型中領跑了Artificial Analysis Intelligence Index，但消耗token較多。在Code Arena WebDev排名第二。儘管在SVG生成方面表現出色，但與前輩GLM-5.1相比不一致。

來源Simon Willison's Weblog

中國AI實驗室Z.ai於6月13日向編程計劃訂閲者發佈了GLM-5.2，隨後於6月16日以MIT許可證完整開放權重。該模型與之前的GLM-5和GLM-5.1規模相似，擁有7530億參數（其中400億激活）及1.51TB的模型大小，採用混合專家架構。GLM-5.2是純文本輸入模型，Z.ai另有獨立的視覺模型系列（最新為GLM-5V-Turbo），但後者未開放權重。GLM-5.2的上下文窗口提升至100萬token，遠超GLM-5.1的20萬token。

模型的發佈引發了廣泛關注。獨立基準測試機構Artificial Analysis稱，GLM-5.2在Artificial Analysis Intelligence Index v4.1中以51分領先其他開放權重模型，超越MiniMax-M3（44分）、DeepSeek V4 Pro（最高44分）和Kimi K2.6（43分）。然而，該模型也存在token消耗較高的問題：每個Intelligence Index任務平均消耗4.3萬輸出token，高於GLM-5.1的2.6萬以及MiniMax-M3、Kimi K2.6和DeepSeek V4 Pro的對應值。

在Code Arena WebDev排行榜上，GLM-5.2位列第二，僅次於Claude Fable 5。該排行榜衡量前端網頁開發任務（包括代理編碼工作流）。鑑於模型缺乏圖像輸入能力，其如此高的排名令人印象深刻——作者原本認為圖像輸入是構建優秀前端編碼模型的關鍵因素。

通過OpenRouter，GLM-5.2可從9個提供商獲取，大部分輸入/輸出定價為每百萬token 1.40美元/4.40美元。相比之下，GPT-5.5為5美元/30美元，Claude Opus 4.5-4.8為5美元/25美元。

在SVG生成測試中，GLM-5.2表現不一。對於“生成一個騎自行車的鵜鶘”的提示，模型返回了自包含的完整動畫SVG，所有動畫均正常運作——包括自行車輪輻、踏板旋轉以及鵜鶘的上下襬動，眼睛也未脱離面部，是一幅非常精美的矢量插畫。然而，對於“生成一個北弗吉尼亞負鼠騎電動滑板車”的提示，結果遠遜於GLM-5.1：背景網格線怪異，滑車不像滑車，負鼠戴着紅色安全帽但幾乎不具辨識度，且模型甚至沒有嘗試加入動畫。相比之下，GLM-5.1生成的版本不僅負鼠栩栩如生，還帶有動態字幕和尾部擺動，僅偶爾眨眼時眼睛會脱離面部。這表明GLM-5.2在性能提升的同時，某些特定任務的質量仍有波動。