2026-06-19 05:52 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

GLM 5.2 在 Fireworks 推理平台上線，零日可用

智譜（Z.ai）發佈的最新開源模型 GLM 5.2 現已通過 Fireworks 推理平台提供。該模型在編程基準測試中表現領先，擁有100萬token的上下文窗口，適用於長週期代理任務，並採用MIT許可證。Fireworks 獨立驗證了模型性能，並強調其基礎設施優勢而非路由。

來源Fireworks AI Blog

智譜（Z.ai，原智譜AI）於2026年6月16日發佈了其新一代旗艦模型 GLM 5.2，並立即在 Fireworks 推理平台上提供零日可用。作為中國AI“六小虎”之一，智譜於2026年初在香港上市，成為全球首家大型模型公司。GLM 5.2 是一款以編程為中心的模型，專為長時間運行的代理任務設計，其核心特性是支持100萬token的上下文窗口。

在發佈之際，智譜公佈了詳細的基準測試結果，聲稱 GLM 5.2 是當前最強的開源編程模型，大幅縮小了與封閉模型的差距。Fireworks 作為領先的推理和訓練平台，在其自有 GPU 和推理引擎上進行了獨立驗證，結果顯示 GLM 5.2 在 GPQA-Diamond 上得分91.4%（181/198，高推理能力），與智譜報告的91.2%相符。這一獨立驗證表明，模型性能並非依賴於特定的基礎設施。

Fireworks 強調，其平台並非路由器，而是直接在自有基礎設施上運行模型。用户請求不會被轉發到其他端點，從而提供完全受控的服務路徑、零數據留存策略和可用性SLA。這種架構對於需要高安全性和可靠性的企業用户尤為重要。

GLM 5.2 專為長週期代理工作設計。在人工智能前沿，開發者不再逐個任務地監督，而是同時運行多個項目，代理的自主工作時間越長，吞吐量越高。GLM 5.2 的100萬token上下文窗口使得代理可以在無人干預的情況下持續工作數小時甚至一整天。然而，維護如此長的上下文窗口在工程上極具挑戰：它需要處理 KV 緩存容量、內核開銷和 CPU 端調度等基礎設施瓶頸。Fireworks 的推理棧正是為應對這些壓力而構建的。

GLM 5.2 採用 MIT 許可證，允許商業使用、修改和再分發，無版權限制或地域限制。這是繼 Kimi、Qwen、DeepSeek 和 MiniMax 之後，開源模型領域的又一重要發佈。儘管美國政策對前沿模型的審查日益嚴格，但開放權重生態系統仍在快速發展。

Fireworks 鼓勵用户自行評估模型性能，因為公開基準測試可能無法反映特定工作負載。平台提供了多種使用方式：通過 Playground 快速體驗、Serverless API（按token付費，默認啓用提示緩存，緩存命中輸入 token 僅需 $0.26/M，輸出 $4.40/M），以及支持 Anthropic 和 OpenAI 兼容的 API。用户還可以將其集成到 Claude Code 或 OpenCode 等編碼代理中。