Qwen 3.7 Plus 現已在 Fireworks 上線
阿里巴巴與 Fireworks 合作,在 Fireworks 基礎設施上獨家託管 Qwen 3.7 Plus 模型。該模型專為智能體循環設計,支持思考與非思考模式,上下文窗口達 262K token,並在多項基準測試中表現優異。Fireworks 作為推理提供商,提供高性能、低延遲的推理服務,數據零保留,SLA 達 99.9%。定價較前代便宜約 50%。
阿里巴巴已與 Fireworks 合作,將其旗艦多模態模型 Qwen 3.7 Plus 託管在 Fireworks 基礎設施上,並通過 Serverless API 提供服務。該模型於 6 月 1 日發佈後,已在多個平台上線,但此次合作不同尋常:Fireworks 是獨家推理提供商,直接運行模型權重,而非通過 API 路由器中轉。
Qwen 3.7 Plus 被定位為“智能體模型”,而非傳統的聊天模型。它能夠理解圖像和文本,支持思考與非思考模式,在需要時進行推理,不需要時跳過。模型上下文窗口高達 262K token,特別適合長週期智能體任務,例如包含截圖、工具調用和緩存上下文的複雜工作流。Fireworks 支持保留跨輪次的思維鏈,開發者可通過設置 reasoning_history="preserved" 來實現。
在定價方面,Qwen 3.7 Plus 的 Serverless 價格為每百萬輸入 token 0.50 美元,緩存輸入 token 僅 0.10 美元,輸出 token 3.00 美元。批量處理價格再降 50%,結果在 24 小時內返回。相比之下,該模型定價比前代 Qwen 3.6 Plus 便宜約 50%。Fireworks 強調,作為推理提供商,他們控制整個服務路徑,承諾零數據保留策略和 99.9% 的正常運行時間 SLA。
基準測試顯示,Qwen 3.7 Plus 開啓思考模式時,在 AIME 2025 上達到了旗艦版 Max 的分數(14/15),速度約為後者的三倍。端到端吞吐量比 Qwen 3.6 Plus 快 3.55 倍。在編碼智能體任務中,模型在多文件開發、調試和問題解決工作流上表現出色。
開發者可以通過 Fireworks 的 Playground、Serverless API 或集成到 Claude Code、OpenCode 等工具中開始使用。API 兼容 OpenAI 和 Anthropic 格式。Fireworks 還提供對 Qwen 3.7 Max 的早期訪問申請,以及按需提供的微調支持。
Qwen 3.7 Plus 的權重為授權許可,不公開發布在 HuggingFace 上。Fireworks 是唯一直接託管這些權重的推理提供商。對於偏好開源模型的用户,Fireworks 也同時提供 Qwen 8B 等開源模型。