AI News HubLIVE
站内改写2 分鐘閱讀

GLM-5.2 可能是最強大的純文本開放權重LLM

中國AI實驗室Z.ai發佈了GLM-5.2,這是一個擁有753B參數、1M token上下文窗口的混合專家模型,採用MIT許可證。它在開放權重模型中領跑了Artificial Analysis Intelligence Index,但消耗token較多。在Code Arena WebDev排名第二。儘管在SVG生成方面表現出色,但與前輩GLM-5.1相比不一致。

中國AI實驗室Z.ai於6月13日向編程計劃訂閲者發佈了GLM-5.2,隨後於6月16日以MIT許可證完整開放權重。該模型與之前的GLM-5和GLM-5.1規模相似,擁有7530億參數(其中400億激活)及1.51TB的模型大小,採用混合專家架構。GLM-5.2是純文本輸入模型,Z.ai另有獨立的視覺模型系列(最新為GLM-5V-Turbo),但後者未開放權重。GLM-5.2的上下文窗口提升至100萬token,遠超GLM-5.1的20萬token。

模型的發佈引發了廣泛關注。獨立基準測試機構Artificial Analysis稱,GLM-5.2在Artificial Analysis Intelligence Index v4.1中以51分領先其他開放權重模型,超越MiniMax-M3(44分)、DeepSeek V4 Pro(最高44分)和Kimi K2.6(43分)。然而,該模型也存在token消耗較高的問題:每個Intelligence Index任務平均消耗4.3萬輸出token,高於GLM-5.1的2.6萬以及MiniMax-M3、Kimi K2.6和DeepSeek V4 Pro的對應值。

在Code Arena WebDev排行榜上,GLM-5.2位列第二,僅次於Claude Fable 5。該排行榜衡量前端網頁開發任務(包括代理編碼工作流)。鑑於模型缺乏圖像輸入能力,其如此高的排名令人印象深刻——作者原本認為圖像輸入是構建優秀前端編碼模型的關鍵因素。

通過OpenRouter,GLM-5.2可從9個提供商獲取,大部分輸入/輸出定價為每百萬token 1.40美元/4.40美元。相比之下,GPT-5.5為5美元/30美元,Claude Opus 4.5-4.8為5美元/25美元。

在SVG生成測試中,GLM-5.2表現不一。對於“生成一個騎自行車的鵜鶘”的提示,模型返回了自包含的完整動畫SVG,所有動畫均正常運作——包括自行車輪輻、踏板旋轉以及鵜鶘的上下襬動,眼睛也未脱離面部,是一幅非常精美的矢量插畫。然而,對於“生成一個北弗吉尼亞負鼠騎電動滑板車”的提示,結果遠遜於GLM-5.1:背景網格線怪異,滑車不像滑車,負鼠戴着紅色安全帽但幾乎不具辨識度,且模型甚至沒有嘗試加入動畫。相比之下,GLM-5.1生成的版本不僅負鼠栩栩如生,還帶有動態字幕和尾部擺動,僅偶爾眨眼時眼睛會脱離面部。這表明GLM-5.2在性能提升的同時,某些特定任務的質量仍有波動。