2026-06-18站内改写2 分鐘閱讀更新: 2026-06-18

開源AI模型GLM-5.2擊敗OpenAI的GPT-5.5，價格僅為其六分之一

GLM-5.2是Z.AI開發的開源旗艦模型，擁有100萬token上下文窗口，在多個編程基準測試中超越GPT-5.5和Claude Opus，成本卻極低。

來源Hacker News AI作者: Raj_Sidwadkar

Z.AI正式發佈了其開源旗艦模型GLM-5.2，這是一款專為長週期任務設計的強大模型。GLM-5.2最引人注目的特性是其真正可用的100萬token上下文窗口，這使得它能夠處理項目級別的工程上下文，並在此過程中保持穩定的執行性能。與僅擴展上下文長度的解決方案不同，GLM-5.2經過數月的專門訓練，針對長週期編碼代理場景進行了優化，覆蓋大規模實現、自動化研究和性能優化等高價值任務。

在標準編程基準測試中，GLM-5.2表現出色，成為最強的開源模型。它在Terminal-Bench 2.1上獲得了81.0分，相比上一代GLM-5.1的62.0分大幅提升，並接近閉源前沿模型Claude Opus 4.8的85.0分。在SWE-bench Pro上，GLM-5.2得分62.1，同樣領先於GLM-5.1的58.4分。更令人印象深刻的是，GLM-5.2在多個基準測試中超越了OpenAI的GPT-5.5，將開源模型與閉源模型之間的差距進一步縮小。

除了強大的基準測試表現，GLM-5.2在實際開發場景中也獲得了開發者的積極反饋。在正式發佈前，GLM-5.2已向GLM編碼計劃用户開放，開發者報告了四個主要改進領域：更強的項目級上下文能力，使得整個代碼庫可以放入一個推理工作流；更穩定的長週期任務執行，防止複雜任務在執行過程中偏離軌道；更可靠地遵循生產級工程標準，幫助團隊開發工作流中的硬約束；以及更強的客户端和移動端工程能力，超越應用生成，支持完整的設備端調試循環。

GLM-5.2還提供了多種思考模式，包括流式輸出、函數調用、上下文緩存、結構化輸出以及MCP集成，使其能夠靈活適應不同場景。在應用方面，GLM-5.2可用於項目級代碼庫接管、長週期重構、生產級標準壓力測試、移動設備端調試、微信小程序開發、小遊戲開發、研究復現以及代碼到視頻生成等多種任務。每個場景都附有推薦的使用方式，幫助開發者快速上手。

對於希望嘗試GLM-5.2的開發者，Z.AI提供了完整的API文檔和快速入門示例，包括cURL、官方Python SDK、官方Java SDK以及OpenAI Python SDK等多種調用方式。基本調用示例展示瞭如何設置系統提示和用户消息，並啓用思考模式以獲得最佳效果。GLM-5.2的發佈標誌着開源AI在編碼領域邁出了重要一步，以極低的成本提供了接近甚至超越閉源前沿模型的性能。