2026-06-17站内改写2 分钟阅读更新: 2026-06-18

GLM-5.2 可能是最强大的纯文本开放权重LLM

中国AI实验室Z.ai发布了GLM-5.2，这是一个拥有753B参数、1M token上下文窗口的混合专家模型，采用MIT许可证。它在开放权重模型中领跑了Artificial Analysis Intelligence Index，但消耗token较多。在Code Arena WebDev排名第二。尽管在SVG生成方面表现出色，但与前辈GLM-5.1相比不一致。

来源Simon Willison's Weblog

中国AI实验室Z.ai于6月13日向编程计划订阅者发布了GLM-5.2，随后于6月16日以MIT许可证完整开放权重。该模型与之前的GLM-5和GLM-5.1规模相似，拥有7530亿参数（其中400亿激活）及1.51TB的模型大小，采用混合专家架构。GLM-5.2是纯文本输入模型，Z.ai另有独立的视觉模型系列（最新为GLM-5V-Turbo），但后者未开放权重。GLM-5.2的上下文窗口提升至100万token，远超GLM-5.1的20万token。

模型的发布引发了广泛关注。独立基准测试机构Artificial Analysis称，GLM-5.2在Artificial Analysis Intelligence Index v4.1中以51分领先其他开放权重模型，超越MiniMax-M3（44分）、DeepSeek V4 Pro（最高44分）和Kimi K2.6（43分）。然而，该模型也存在token消耗较高的问题：每个Intelligence Index任务平均消耗4.3万输出token，高于GLM-5.1的2.6万以及MiniMax-M3、Kimi K2.6和DeepSeek V4 Pro的对应值。

在Code Arena WebDev排行榜上，GLM-5.2位列第二，仅次于Claude Fable 5。该排行榜衡量前端网页开发任务（包括代理编码工作流）。鉴于模型缺乏图像输入能力，其如此高的排名令人印象深刻——作者原本认为图像输入是构建优秀前端编码模型的关键因素。

通过OpenRouter，GLM-5.2可从9个提供商获取，大部分输入/输出定价为每百万token 1.40美元/4.40美元。相比之下，GPT-5.5为5美元/30美元，Claude Opus 4.5-4.8为5美元/25美元。

在SVG生成测试中，GLM-5.2表现不一。对于“生成一个骑自行车的鹈鹕”的提示，模型返回了自包含的完整动画SVG，所有动画均正常运作——包括自行车轮辐、踏板旋转以及鹈鹕的上下摆动，眼睛也未脱离面部，是一幅非常精美的矢量插画。然而，对于“生成一个北弗吉尼亚负鼠骑电动滑板车”的提示，结果远逊于GLM-5.1：背景网格线怪异，滑车不像滑车，负鼠戴着红色安全帽但几乎不具辨识度，且模型甚至没有尝试加入动画。相比之下，GLM-5.1生成的版本不仅负鼠栩栩如生，还带有动态字幕和尾部摆动，仅偶尔眨眼时眼睛会脱离面部。这表明GLM-5.2在性能提升的同时，某些特定任务的质量仍有波动。