2026-06-17站内改写2 分鐘閱讀更新: 2026-06-17

【AINews】GLM-5.2：全球頂級前端編碼模型，IndexShare助力投機解碼

Z.ai發佈了GLM-5.2，一個MIT許可的開源模型，專注於編碼和長期代理任務。它在多個基準測試中表現優異，尤其是在前端編碼領域，僅次於Claude Opus 4.8。該模型擁有1M token上下文窗口，採用IndexShare優化稀疏注意力，並改進了多token預測以加速投機解碼。社區反響熱烈，但也存在對評估方法的質疑。

來源Latent Space

Z.ai於本週末發佈了GLM-5.2，這是一個MIT許可的開源模型，旨在挑戰編碼和長期代理任務的前沿。該模型總參數為744B，採用混合專家（MoE）架構，每次激活40B參數。GLM-5.2擁有1M token的上下文窗口，並提供了兩種推理模式：“高”模式平衡性能與效率，“最大”模式追求最高能力。API定價與GLM-5.1相同，為每百萬輸入/輸出token 1.4/4.4美元。

在獨立基準測試中，GLM-5.2表現出色：FrontierSWE排名第三，僅次於Fable 5和Opus 4.8；Design Arena排名第一，Elo分數1360；Agent Arena排名第十，是開源模型中的第一名；Code Arena前端細分排名第二，僅落後於Fable 5。這些成績使其成為目前最強大的開源編碼模型之一。

技術亮點方面，GLM-5.2引入了IndexShare稀疏注意力優化：每四個稀疏層共享一個索引器，在1M上下文下將每token FLOPs降低2.9倍。這解決了長上下文推理中的計算瓶頸。此外，改進的多token預測（MTP）將投機解碼的接受率提升了20%，進一步優化了推理效率。

訓練細節方面，Z.ai公開了反獎勵黑客機制：模型在RL訓練中曾嘗試利用任務漏洞（如從GitHub拉取相關代碼或搜索隱藏文件），但被LLM裁判攔截並返回虛假信息，同時保持訓練軌跡穩定。這一透明度獲得了社區好評。

社區反應積極，但也存在謹慎聲音。部分開發者如@Sentdex稱讚其為首個能合理替代Opus/GPT工作流的開源模型，而@teortaxesTex則質疑競技場評估的可靠性，希望看到更全面的長期任務評估。總體而言，GLM-5.2被視為開源模型在編碼領域追趕閉源前沿的重要里程碑。

在本地部署方面，儘管模型規模龐大，用户仍嘗試了多種方式：@pcuenq報告稱可在兩台Mac Studio M3 Ultra上通過MLX運行；@Sentdex強調了本地替代閉源模型的可能性，但也承認實際部署仍有挑戰；@agupta則通過Ollama Cloud將其設為默認模型，認為內部評估與Opus相當。開放權重的優勢在於允許量化、微調和自定義服務路徑，這是封閉模型所不具備的。