GLM 5.2 在 Fireworks 推理平臺上線,零日可用
智譜(Z.ai)釋出的最新開源模型 GLM 5.2 現已透過 Fireworks 推理平臺提供。該模型在程式設計基準測試中表現領先,擁有100萬token的上下文視窗,適用於長週期代理任務,並採用MIT許可證。Fireworks 獨立驗證了模型效能,並強調其基礎設施優勢而非路由。
智譜(Z.ai,原智譜AI)於2026年6月16日釋出了其新一代旗艦模型 GLM 5.2,並立即在 Fireworks 推理平臺上提供零日可用。作為中國AI“六小虎”之一,智譜於2026年初在香港上市,成為全球首家大型模型公司。GLM 5.2 是一款以程式設計為中心的模型,專為長時間執行的代理任務設計,其核心特性是支援100萬token的上下文視窗。
在釋出之際,智譜公佈了詳細的基準測試結果,聲稱 GLM 5.2 是當前最強的開源程式設計模型,大幅縮小了與封閉模型的差距。Fireworks 作為領先的推理和訓練平臺,在其自有 GPU 和推理引擎上進行了獨立驗證,結果顯示 GLM 5.2 在 GPQA-Diamond 上得分91.4%(181/198,高推理能力),與智譜報告的91.2%相符。這一獨立驗證表明,模型效能並非依賴於特定的基礎設施。
Fireworks 強調,其平臺並非路由器,而是直接在自有基礎設施上執行模型。使用者請求不會被轉發到其他端點,從而提供完全受控的服務路徑、零資料留存策略和可用性SLA。這種架構對於需要高安全性和可靠性的企業使用者尤為重要。
GLM 5.2 專為長週期代理工作設計。在人工智慧前沿,開發者不再逐個任務地監督,而是同時執行多個專案,代理的自主工作時間越長,吞吐量越高。GLM 5.2 的100萬token上下文視窗使得代理可以在無人干預的情況下持續工作數小時甚至一整天。然而,維護如此長的上下文視窗在工程上極具挑戰:它需要處理 KV 快取容量、核心開銷和 CPU 端排程等基礎設施瓶頸。Fireworks 的推理棧正是為應對這些壓力而構建的。
GLM 5.2 採用 MIT 許可證,允許商業使用、修改和再分發,無版許可權制或地域限制。這是繼 Kimi、Qwen、DeepSeek 和 MiniMax 之後,開源模型領域的又一重要釋出。儘管美國政策對前沿模型的審查日益嚴格,但開放權重生態系統仍在快速發展。
Fireworks 鼓勵使用者自行評估模型效能,因為公開基準測試可能無法反映特定工作負載。平臺提供了多種使用方式:透過 Playground 快速體驗、Serverless API(按token付費,預設啟用提示快取,快取命中輸入 token 僅需 $0.26/M,輸出 $4.40/M),以及支援 Anthropic 和 OpenAI 相容的 API。使用者還可以將其整合到 Claude Code 或 OpenCode 等編碼代理中。