2026-06-15站内改写2 分鐘閱讀更新: 2026-06-15

Z.ai 釋出 GLM-5.2：支援 100 萬 token 上下文、兩種思考深度級別，釋出時未附帶基準測試

Z.ai 於 2026 年 6 月 13 日釋出了 GLM-5.2，這是其旗艦編碼模型系列的最新版本。主要特性包括 100 萬 token 的上下文視窗（約為 GLM-5.1 的 5 倍）、131,072 個輸出 token 以及兩種思考深度級別（High 和 Max）。該模型可無縫整合到 Claude Code、Cline 和 OpenClaw 等工具中，作為一個即插即用的替代方案。值得注意的是，Z.ai 在釋出時未公佈任何基準測試分數，但承諾將在下週釋出 MIT 開源權重。

來源MarkTechPost作者: Michal Sutter

Z.ai 於 2026 年 6 月 13 日正式釋出了 GLM-5.2，這是其 GLM-5 系列大語言模型的第三次重大更新。該系列此前已推出 GLM-5（2 月 11 日）、GLM-5-Turbo（3 月 15 日）和 GLM-5.1（4 月 7 日），意味著在約四個月內釋出了四款旗艦級編碼模型。

GLM-5.2 最引人注目的特性是其 100 萬 token（1M）的上下文視窗，官方將其標識為 glm-5.2[1m]。每個響應最多可輸出 131,072 個 token，相比 GLM-5.1 的 20 萬 token 視窗提升了約 5 倍。這一超大上下文視窗在實際應用中意味著編碼代理可以將整個中型程式碼庫（包括原始檔、測試檔案、配置檔案和對話歷史）儲存在工作記憶體中，從而避免了因視窗較小而頻繁進行摘要總結的需求。

除了上下文視窗，GLM-5.2 還引入了兩種思考深度級別：High 和 Max。Z.ai 建議在複雜、多步驟的編碼工作中使用 Max 級別。在 Claude Code 中，可透過 /effort 命令進行控制，其中 xhigh、max 和 ultracode 選項均對映到 GLM-5.2 的 Max 級別。

關於架構細節，Z.ai 在釋出材料中並未明確說明。但根據社群資訊，GLM-5 基礎模型是一個 7440 億引數的混合專家（MoE）模型，每個 token 啟用 400 億引數。GLM-5.1 保持了相同的骨幹網路，僅調整了後訓練策略。

一個重要注意事項是，Z.ai 在釋出時未公佈任何基準測試分數。無論是 SWE-bench、Terminal-Bench 還是 Code Arena，均無相關資料。公告重點集中在可用性、上下文視窗和開源路線圖上。相比之下，GLM-5.1 在釋出時曾公佈 SWE-bench Pro 58.4% 的成績。

GLM-5.2 的應用場景包括：

整個程式碼庫重構：將中型程式碼庫載入到單個上下文視窗中，代理可跟蹤跨檔案依賴關係而無需重新獲取。例如，在單次會話中重構一個包含 40 個檔案的 Python 資料管道。
長時間執行的代理任務：GLM-5.2 面向持續的規劃、執行、測試和修復迴圈。GLM-5.1 曾支援約 1,700 個代理步驟，可持續執行長達八小時。GLM-5.2 繼承了這一能力。
Claude Code 的即插即用替代：僅需切換基礎 URL 和模型識別符號，即可保留現有代理框架和工作流程。
大型文件分析：處理超過 20 萬 token 的規格說明、日誌或轉錄文本。

設定方面，對於 Claude Code，使用者需編輯 ~/.claude/settings.json 檔案，將 Sonnet 和 Opus 模型指向 1M 變體，並提高自動壓縮視窗以充分利用上下文。對於 Cline，選擇 OpenAI 相容提供商，設定基礎 URL 為 https://api.z.ai/api/coding/paas/v4，並輸入自定義模型 glm-5.2 及上下文大小 1,000,000。

GLM-5.2 釋出首日即支援八種代理編碼工具，包括 Claude Code、Cline、OpenCode 和 OpenClaw。該模型現已面向所有 GLM Coding Plan 使用者（包括 Lite、Pro、Max 和 Team 層級）開放。Z.ai 承諾將於下週釋出 MIT 開源權重。