GLM 5.2 在 Fireworks 推理平台上线,零日可用
智谱(Z.ai)发布的最新开源模型 GLM 5.2 现已通过 Fireworks 推理平台提供。该模型在编程基准测试中表现领先,拥有100万token的上下文窗口,适用于长周期代理任务,并采用MIT许可证。Fireworks 独立验证了模型性能,并强调其基础设施优势而非路由。
智谱(Z.ai,原智谱AI)于2026年6月16日发布了其新一代旗舰模型 GLM 5.2,并立即在 Fireworks 推理平台上提供零日可用。作为中国AI“六小虎”之一,智谱于2026年初在香港上市,成为全球首家大型模型公司。GLM 5.2 是一款以编程为中心的模型,专为长时间运行的代理任务设计,其核心特性是支持100万token的上下文窗口。
在发布之际,智谱公布了详细的基准测试结果,声称 GLM 5.2 是当前最强的开源编程模型,大幅缩小了与封闭模型的差距。Fireworks 作为领先的推理和训练平台,在其自有 GPU 和推理引擎上进行了独立验证,结果显示 GLM 5.2 在 GPQA-Diamond 上得分91.4%(181/198,高推理能力),与智谱报告的91.2%相符。这一独立验证表明,模型性能并非依赖于特定的基础设施。
Fireworks 强调,其平台并非路由器,而是直接在自有基础设施上运行模型。用户请求不会被转发到其他端点,从而提供完全受控的服务路径、零数据留存策略和可用性SLA。这种架构对于需要高安全性和可靠性的企业用户尤为重要。
GLM 5.2 专为长周期代理工作设计。在人工智能前沿,开发者不再逐个任务地监督,而是同时运行多个项目,代理的自主工作时间越长,吞吐量越高。GLM 5.2 的100万token上下文窗口使得代理可以在无人干预的情况下持续工作数小时甚至一整天。然而,维护如此长的上下文窗口在工程上极具挑战:它需要处理 KV 缓存容量、内核开销和 CPU 端调度等基础设施瓶颈。Fireworks 的推理栈正是为应对这些压力而构建的。
GLM 5.2 采用 MIT 许可证,允许商业使用、修改和再分发,无版权限制或地域限制。这是继 Kimi、Qwen、DeepSeek 和 MiniMax 之后,开源模型领域的又一重要发布。尽管美国政策对前沿模型的审查日益严格,但开放权重生态系统仍在快速发展。
Fireworks 鼓励用户自行评估模型性能,因为公开基准测试可能无法反映特定工作负载。平台提供了多种使用方式:通过 Playground 快速体验、Serverless API(按token付费,默认启用提示缓存,缓存命中输入 token 仅需 $0.26/M,输出 $4.40/M),以及支持 Anthropic 和 OpenAI 兼容的 API。用户还可以将其集成到 Claude Code 或 OpenCode 等编码代理中。