Z.ai 發佈 GLM-5.2:支持 100 萬 token 上下文、兩種思考深度級別,發佈時未附帶基準測試
Z.ai 於 2026 年 6 月 13 日發佈了 GLM-5.2,這是其旗艦編碼模型系列的最新版本。主要特性包括 100 萬 token 的上下文窗口(約為 GLM-5.1 的 5 倍)、131,072 個輸出 token 以及兩種思考深度級別(High 和 Max)。該模型可無縫集成到 Claude Code、Cline 和 OpenClaw 等工具中,作為一個即插即用的替代方案。值得注意的是,Z.ai 在發佈時未公佈任何基準測試分數,但承諾將在下週發佈 MIT 開源權重。
Z.ai 於 2026 年 6 月 13 日正式發佈了 GLM-5.2,這是其 GLM-5 系列大語言模型的第三次重大更新。該系列此前已推出 GLM-5(2 月 11 日)、GLM-5-Turbo(3 月 15 日)和 GLM-5.1(4 月 7 日),意味着在約四個月內發佈了四款旗艦級編碼模型。
GLM-5.2 最引人注目的特性是其 100 萬 token(1M)的上下文窗口,官方將其標識為 glm-5.2[1m]。每個響應最多可輸出 131,072 個 token,相比 GLM-5.1 的 20 萬 token 窗口提升了約 5 倍。這一超大上下文窗口在實際應用中意味着編碼代理可以將整個中型代碼庫(包括源文件、測試文件、配置文件和對話歷史)保存在工作內存中,從而避免了因窗口較小而頻繁進行摘要總結的需求。
除了上下文窗口,GLM-5.2 還引入了兩種思考深度級別:High 和 Max。Z.ai 建議在複雜、多步驟的編碼工作中使用 Max 級別。在 Claude Code 中,可通過 /effort 命令進行控制,其中 xhigh、max 和 ultracode 選項均映射到 GLM-5.2 的 Max 級別。
關於架構細節,Z.ai 在發佈材料中並未明確説明。但根據社區信息,GLM-5 基礎模型是一個 7440 億參數的混合專家(MoE)模型,每個 token 激活 400 億參數。GLM-5.1 保持了相同的骨幹網絡,僅調整了後訓練策略。
一個重要注意事項是,Z.ai 在發佈時未公佈任何基準測試分數。無論是 SWE-bench、Terminal-Bench 還是 Code Arena,均無相關數據。公告重點集中在可用性、上下文窗口和開源路線圖上。相比之下,GLM-5.1 在發佈時曾公佈 SWE-bench Pro 58.4% 的成績。
GLM-5.2 的應用場景包括:
- 整個代碼庫重構:將中型代碼庫加載到單個上下文窗口中,代理可跟蹤跨文件依賴關係而無需重新獲取。例如,在單次會話中重構一個包含 40 個文件的 Python 數據管道。
- 長時間運行的代理任務:GLM-5.2 面向持續的規劃、執行、測試和修復循環。GLM-5.1 曾支持約 1,700 個代理步驟,可持續運行長達八小時。GLM-5.2 繼承了這一能力。
- Claude Code 的即插即用替代:僅需切換基礎 URL 和模型標識符,即可保留現有代理框架和工作流程。
- 大型文檔分析:處理超過 20 萬 token 的規格説明、日誌或轉錄文本。
設置方面,對於 Claude Code,用户需編輯 ~/.claude/settings.json 文件,將 Sonnet 和 Opus 模型指向 1M 變體,並提高自動壓縮窗口以充分利用上下文。對於 Cline,選擇 OpenAI 兼容提供商,設置基礎 URL 為 https://api.z.ai/api/coding/paas/v4,並輸入自定義模型 glm-5.2 及上下文大小 1,000,000。
GLM-5.2 發佈首日即支持八種代理編碼工具,包括 Claude Code、Cline、OpenCode 和 OpenClaw。該模型現已面向所有 GLM Coding Plan 用户(包括 Lite、Pro、Max 和 Team 層級)開放。Z.ai 承諾將於下週發佈 MIT 開源權重。