開源AI模型GLM-5.2擊敗OpenAI的GPT-5.5,價格僅為其六分之一
GLM-5.2是Z.AI開發的開源旗艦模型,擁有100萬token上下文窗口,在多個編程基準測試中超越GPT-5.5和Claude Opus,成本卻極低。
Z.AI正式發佈了其開源旗艦模型GLM-5.2,這是一款專為長週期任務設計的強大模型。GLM-5.2最引人注目的特性是其真正可用的100萬token上下文窗口,這使得它能夠處理項目級別的工程上下文,並在此過程中保持穩定的執行性能。與僅擴展上下文長度的解決方案不同,GLM-5.2經過數月的專門訓練,針對長週期編碼代理場景進行了優化,覆蓋大規模實現、自動化研究和性能優化等高價值任務。
在標準編程基準測試中,GLM-5.2表現出色,成為最強的開源模型。它在Terminal-Bench 2.1上獲得了81.0分,相比上一代GLM-5.1的62.0分大幅提升,並接近閉源前沿模型Claude Opus 4.8的85.0分。在SWE-bench Pro上,GLM-5.2得分62.1,同樣領先於GLM-5.1的58.4分。更令人印象深刻的是,GLM-5.2在多個基準測試中超越了OpenAI的GPT-5.5,將開源模型與閉源模型之間的差距進一步縮小。
除了強大的基準測試表現,GLM-5.2在實際開發場景中也獲得了開發者的積極反饋。在正式發佈前,GLM-5.2已向GLM編碼計劃用户開放,開發者報告了四個主要改進領域:更強的項目級上下文能力,使得整個代碼庫可以放入一個推理工作流;更穩定的長週期任務執行,防止複雜任務在執行過程中偏離軌道;更可靠地遵循生產級工程標準,幫助團隊開發工作流中的硬約束;以及更強的客户端和移動端工程能力,超越應用生成,支持完整的設備端調試循環。
GLM-5.2還提供了多種思考模式,包括流式輸出、函數調用、上下文緩存、結構化輸出以及MCP集成,使其能夠靈活適應不同場景。在應用方面,GLM-5.2可用於項目級代碼庫接管、長週期重構、生產級標準壓力測試、移動設備端調試、微信小程序開發、小遊戲開發、研究復現以及代碼到視頻生成等多種任務。每個場景都附有推薦的使用方式,幫助開發者快速上手。
對於希望嘗試GLM-5.2的開發者,Z.AI提供了完整的API文檔和快速入門示例,包括cURL、官方Python SDK、官方Java SDK以及OpenAI Python SDK等多種調用方式。基本調用示例展示瞭如何設置系統提示和用户消息,並啓用思考模式以獲得最佳效果。GLM-5.2的發佈標誌着開源AI在編碼領域邁出了重要一步,以極低的成本提供了接近甚至超越閉源前沿模型的性能。