AI News HubLIVE
站内改写2 分钟阅读

GLM-5.2 可能是最强大的纯文本开放权重LLM

中国AI实验室Z.ai发布了GLM-5.2,这是一个拥有753B参数、1M token上下文窗口的混合专家模型,采用MIT许可证。它在开放权重模型中领跑了Artificial Analysis Intelligence Index,但消耗token较多。在Code Arena WebDev排名第二。尽管在SVG生成方面表现出色,但与前辈GLM-5.1相比不一致。

中国AI实验室Z.ai于6月13日向编程计划订阅者发布了GLM-5.2,随后于6月16日以MIT许可证完整开放权重。该模型与之前的GLM-5和GLM-5.1规模相似,拥有7530亿参数(其中400亿激活)及1.51TB的模型大小,采用混合专家架构。GLM-5.2是纯文本输入模型,Z.ai另有独立的视觉模型系列(最新为GLM-5V-Turbo),但后者未开放权重。GLM-5.2的上下文窗口提升至100万token,远超GLM-5.1的20万token。

模型的发布引发了广泛关注。独立基准测试机构Artificial Analysis称,GLM-5.2在Artificial Analysis Intelligence Index v4.1中以51分领先其他开放权重模型,超越MiniMax-M3(44分)、DeepSeek V4 Pro(最高44分)和Kimi K2.6(43分)。然而,该模型也存在token消耗较高的问题:每个Intelligence Index任务平均消耗4.3万输出token,高于GLM-5.1的2.6万以及MiniMax-M3、Kimi K2.6和DeepSeek V4 Pro的对应值。

在Code Arena WebDev排行榜上,GLM-5.2位列第二,仅次于Claude Fable 5。该排行榜衡量前端网页开发任务(包括代理编码工作流)。鉴于模型缺乏图像输入能力,其如此高的排名令人印象深刻——作者原本认为图像输入是构建优秀前端编码模型的关键因素。

通过OpenRouter,GLM-5.2可从9个提供商获取,大部分输入/输出定价为每百万token 1.40美元/4.40美元。相比之下,GPT-5.5为5美元/30美元,Claude Opus 4.5-4.8为5美元/25美元。

在SVG生成测试中,GLM-5.2表现不一。对于“生成一个骑自行车的鹈鹕”的提示,模型返回了自包含的完整动画SVG,所有动画均正常运作——包括自行车轮辐、踏板旋转以及鹈鹕的上下摆动,眼睛也未脱离面部,是一幅非常精美的矢量插画。然而,对于“生成一个北弗吉尼亚负鼠骑电动滑板车”的提示,结果远逊于GLM-5.1:背景网格线怪异,滑车不像滑车,负鼠戴着红色安全帽但几乎不具辨识度,且模型甚至没有尝试加入动画。相比之下,GLM-5.1生成的版本不仅负鼠栩栩如生,还带有动态字幕和尾部摆动,仅偶尔眨眼时眼睛会脱离面部。这表明GLM-5.2在性能提升的同时,某些特定任务的质量仍有波动。