2026-06-15站内改写2 分钟阅读更新: 2026-06-15

Z.ai 发布 GLM-5.2：支持 100 万 token 上下文、两种思考深度级别，发布时未附带基准测试

Z.ai 于 2026 年 6 月 13 日发布了 GLM-5.2，这是其旗舰编码模型系列的最新版本。主要特性包括 100 万 token 的上下文窗口（约为 GLM-5.1 的 5 倍）、131,072 个输出 token 以及两种思考深度级别（High 和 Max）。该模型可无缝集成到 Claude Code、Cline 和 OpenClaw 等工具中，作为一个即插即用的替代方案。值得注意的是，Z.ai 在发布时未公布任何基准测试分数，但承诺将在下周发布 MIT 开源权重。

来源MarkTechPost作者: Michal Sutter

Z.ai 于 2026 年 6 月 13 日正式发布了 GLM-5.2，这是其 GLM-5 系列大语言模型的第三次重大更新。该系列此前已推出 GLM-5（2 月 11 日）、GLM-5-Turbo（3 月 15 日）和 GLM-5.1（4 月 7 日），意味着在约四个月内发布了四款旗舰级编码模型。

GLM-5.2 最引人注目的特性是其 100 万 token（1M）的上下文窗口，官方将其标识为 glm-5.2[1m]。每个响应最多可输出 131,072 个 token，相比 GLM-5.1 的 20 万 token 窗口提升了约 5 倍。这一超大上下文窗口在实际应用中意味着编码代理可以将整个中型代码库（包括源文件、测试文件、配置文件和对话历史）保存在工作内存中，从而避免了因窗口较小而频繁进行摘要总结的需求。

除了上下文窗口，GLM-5.2 还引入了两种思考深度级别：High 和 Max。Z.ai 建议在复杂、多步骤的编码工作中使用 Max 级别。在 Claude Code 中，可通过 /effort 命令进行控制，其中 xhigh、max 和 ultracode 选项均映射到 GLM-5.2 的 Max 级别。

关于架构细节，Z.ai 在发布材料中并未明确说明。但根据社区信息，GLM-5 基础模型是一个 7440 亿参数的混合专家（MoE）模型，每个 token 激活 400 亿参数。GLM-5.1 保持了相同的骨干网络，仅调整了后训练策略。

一个重要注意事项是，Z.ai 在发布时未公布任何基准测试分数。无论是 SWE-bench、Terminal-Bench 还是 Code Arena，均无相关数据。公告重点集中在可用性、上下文窗口和开源路线图上。相比之下，GLM-5.1 在发布时曾公布 SWE-bench Pro 58.4% 的成绩。

GLM-5.2 的应用场景包括：

整个代码库重构：将中型代码库加载到单个上下文窗口中，代理可跟踪跨文件依赖关系而无需重新获取。例如，在单次会话中重构一个包含 40 个文件的 Python 数据管道。
长时间运行的代理任务：GLM-5.2 面向持续的规划、执行、测试和修复循环。GLM-5.1 曾支持约 1,700 个代理步骤，可持续运行长达八小时。GLM-5.2 继承了这一能力。
Claude Code 的即插即用替代：仅需切换基础 URL 和模型标识符，即可保留现有代理框架和工作流程。
大型文档分析：处理超过 20 万 token 的规格说明、日志或转录文本。

设置方面，对于 Claude Code，用户需编辑 ~/.claude/settings.json 文件，将 Sonnet 和 Opus 模型指向 1M 变体，并提高自动压缩窗口以充分利用上下文。对于 Cline，选择 OpenAI 兼容提供商，设置基础 URL 为 https://api.z.ai/api/coding/paas/v4，并输入自定义模型 glm-5.2 及上下文大小 1,000,000。

GLM-5.2 发布首日即支持八种代理编码工具，包括 Claude Code、Cline、OpenCode 和 OpenClaw。该模型现已面向所有 GLM Coding Plan 用户（包括 Lite、Pro、Max 和 Team 层级）开放。Z.ai 承诺将于下周发布 MIT 开源权重。