2026-06-18站内改写2 分钟阅读更新: 2026-06-18

开源AI模型GLM-5.2击败OpenAI的GPT-5.5，价格仅为其六分之一

GLM-5.2是Z.AI开发的开源旗舰模型，拥有100万token上下文窗口，在多个编程基准测试中超越GPT-5.5和Claude Opus，成本却极低。

来源Hacker News AI作者: Raj_Sidwadkar

Z.AI正式发布了其开源旗舰模型GLM-5.2，这是一款专为长周期任务设计的强大模型。GLM-5.2最引人注目的特性是其真正可用的100万token上下文窗口，这使得它能够处理项目级别的工程上下文，并在此过程中保持稳定的执行性能。与仅扩展上下文长度的解决方案不同，GLM-5.2经过数月的专门训练，针对长周期编码代理场景进行了优化，覆盖大规模实现、自动化研究和性能优化等高价值任务。

在标准编程基准测试中，GLM-5.2表现出色，成为最强的开源模型。它在Terminal-Bench 2.1上获得了81.0分，相比上一代GLM-5.1的62.0分大幅提升，并接近闭源前沿模型Claude Opus 4.8的85.0分。在SWE-bench Pro上，GLM-5.2得分62.1，同样领先于GLM-5.1的58.4分。更令人印象深刻的是，GLM-5.2在多个基准测试中超越了OpenAI的GPT-5.5，将开源模型与闭源模型之间的差距进一步缩小。

除了强大的基准测试表现，GLM-5.2在实际开发场景中也获得了开发者的积极反馈。在正式发布前，GLM-5.2已向GLM编码计划用户开放，开发者报告了四个主要改进领域：更强的项目级上下文能力，使得整个代码库可以放入一个推理工作流；更稳定的长周期任务执行，防止复杂任务在执行过程中偏离轨道；更可靠地遵循生产级工程标准，帮助团队开发工作流中的硬约束；以及更强的客户端和移动端工程能力，超越应用生成，支持完整的设备端调试循环。

GLM-5.2还提供了多种思考模式，包括流式输出、函数调用、上下文缓存、结构化输出以及MCP集成，使其能够灵活适应不同场景。在应用方面，GLM-5.2可用于项目级代码库接管、长周期重构、生产级标准压力测试、移动设备端调试、微信小程序开发、小游戏开发、研究复现以及代码到视频生成等多种任务。每个场景都附有推荐的使用方式，帮助开发者快速上手。

对于希望尝试GLM-5.2的开发者，Z.AI提供了完整的API文档和快速入门示例，包括cURL、官方Python SDK、官方Java SDK以及OpenAI Python SDK等多种调用方式。基本调用示例展示了如何设置系统提示和用户消息，并启用思考模式以获得最佳效果。GLM-5.2的发布标志着开源AI在编码领域迈出了重要一步，以极低的成本提供了接近甚至超越闭源前沿模型的性能。