开源AI模型GLM-5.2击败OpenAI的GPT-5.5,价格仅为其六分之一
GLM-5.2是Z.AI开发的开源旗舰模型,拥有100万token上下文窗口,在多个编程基准测试中超越GPT-5.5和Claude Opus,成本却极低。
Z.AI正式发布了其开源旗舰模型GLM-5.2,这是一款专为长周期任务设计的强大模型。GLM-5.2最引人注目的特性是其真正可用的100万token上下文窗口,这使得它能够处理项目级别的工程上下文,并在此过程中保持稳定的执行性能。与仅扩展上下文长度的解决方案不同,GLM-5.2经过数月的专门训练,针对长周期编码代理场景进行了优化,覆盖大规模实现、自动化研究和性能优化等高价值任务。
在标准编程基准测试中,GLM-5.2表现出色,成为最强的开源模型。它在Terminal-Bench 2.1上获得了81.0分,相比上一代GLM-5.1的62.0分大幅提升,并接近闭源前沿模型Claude Opus 4.8的85.0分。在SWE-bench Pro上,GLM-5.2得分62.1,同样领先于GLM-5.1的58.4分。更令人印象深刻的是,GLM-5.2在多个基准测试中超越了OpenAI的GPT-5.5,将开源模型与闭源模型之间的差距进一步缩小。
除了强大的基准测试表现,GLM-5.2在实际开发场景中也获得了开发者的积极反馈。在正式发布前,GLM-5.2已向GLM编码计划用户开放,开发者报告了四个主要改进领域:更强的项目级上下文能力,使得整个代码库可以放入一个推理工作流;更稳定的长周期任务执行,防止复杂任务在执行过程中偏离轨道;更可靠地遵循生产级工程标准,帮助团队开发工作流中的硬约束;以及更强的客户端和移动端工程能力,超越应用生成,支持完整的设备端调试循环。
GLM-5.2还提供了多种思考模式,包括流式输出、函数调用、上下文缓存、结构化输出以及MCP集成,使其能够灵活适应不同场景。在应用方面,GLM-5.2可用于项目级代码库接管、长周期重构、生产级标准压力测试、移动设备端调试、微信小程序开发、小游戏开发、研究复现以及代码到视频生成等多种任务。每个场景都附有推荐的使用方式,帮助开发者快速上手。
对于希望尝试GLM-5.2的开发者,Z.AI提供了完整的API文档和快速入门示例,包括cURL、官方Python SDK、官方Java SDK以及OpenAI Python SDK等多种调用方式。基本调用示例展示了如何设置系统提示和用户消息,并启用思考模式以获得最佳效果。GLM-5.2的发布标志着开源AI在编码领域迈出了重要一步,以极低的成本提供了接近甚至超越闭源前沿模型的性能。