2026-06-13 13:37 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

Qwen 3.7 Plus 現已在 Fireworks 上線

阿里巴巴與 Fireworks 合作，在 Fireworks 基礎設施上獨家託管 Qwen 3.7 Plus 模型。該模型專為智慧體迴圈設計，支援思考與非思考模式，上下文視窗達 262K token，並在多項基準測試中表現優異。Fireworks 作為推理提供商，提供高效能、低延遲的推理服務，資料零保留，SLA 達 99.9%。定價較前代便宜約 50%。

來源Fireworks AI Blog

阿里巴巴已與 Fireworks 合作，將其旗艦多模態模型 Qwen 3.7 Plus 託管在 Fireworks 基礎設施上，並透過 Serverless API 提供服務。該模型於 6 月 1 日釋出後，已在多個平臺上線，但此次合作不同尋常：Fireworks 是獨家推理提供商，直接執行模型權重，而非透過 API 路由器中轉。

Qwen 3.7 Plus 被定位為“智慧體模型”，而非傳統的聊天模型。它能夠理解影像和文本，支援思考與非思考模式，在需要時進行推理，不需要時跳過。模型上下文視窗高達 262K token，特別適合長週期智慧體任務，例如包含截圖、工具呼叫和快取上下文的複雜工作流。Fireworks 支援保留跨輪次的思維鏈，開發者可透過設定 reasoning_history="preserved" 來實現。

在定價方面，Qwen 3.7 Plus 的 Serverless 價格為每百萬輸入 token 0.50 美元，快取輸入 token 僅 0.10 美元，輸出 token 3.00 美元。批次處理價格再降 50%，結果在 24 小時內返回。相比之下，該模型定價比前代 Qwen 3.6 Plus 便宜約 50%。Fireworks 強調，作為推理提供商，他們控制整個服務路徑，承諾零資料保留策略和 99.9% 的正常執行時間 SLA。

基準測試顯示，Qwen 3.7 Plus 開啟思考模式時，在 AIME 2025 上達到了旗艦版 Max 的分數（14/15），速度約為後者的三倍。端到端吞吐量比 Qwen 3.6 Plus 快 3.55 倍。在編碼智慧體任務中，模型在多檔案開發、除錯和問題解決工作流上表現出色。

開發者可以透過 Fireworks 的 Playground、Serverless API 或整合到 Claude Code、OpenCode 等工具中開始使用。API 相容 OpenAI 和 Anthropic 格式。Fireworks 還提供對 Qwen 3.7 Max 的早期訪問申請，以及按需提供的微調支援。

Qwen 3.7 Plus 的權重為授權許可，不公開發布在 HuggingFace 上。Fireworks 是唯一直接託管這些權重的推理提供商。對於偏好開源模型的使用者，Fireworks 也同時提供 Qwen 8B 等開源模型。