2026-06-13 14:37 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

Qwen 3.7 Plus が Fireworks で利用可能に

Alibaba は Fireworks と提携し、Qwen 3.7 Plus を Fireworks のインフラ上でホスティング、サーバーレス API として提供開始。エージェントループ向けに設計され、思考モードと非思考モードをサポート、コンテキストウィンドウは 262K トークン。前世代比約 50% の価格低下。Fireworks はデータ保持ゼロポリシーと 99.9% のアップタイム SLA を提供。

ソースFireworks AI Blog

記事インテリジェンス

エンジニア中級

要点

Qwen 3.7 Plus は Fireworks のサーバーレス API で独占利用可能に。
エージェントワークロード向けに最適化され、画像入力と思考連鎖の保持に対応。
Fireworks は直接推論プロバイダーであり、データガバナンスと低レイテンシーを実現。
価格は Qwen 3.6 Plus より約 50% 低く、OpenAI および Anthropic 互換 API を提供。

重要な理由

このニュースが重要なのは、Qwen 3.7 Plus は Fireworks のサーバーレス API で独占利用可能にためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Alibaba は Fireworks と提携し、フラッグシップマルチモーダルモデル Qwen 3.7 Plus を Fireworks のインフラ上でホスティングし、サーバーレス API として提供開始しました。本モデルは 6 月 1 日の発表後、複数のプラットフォームで利用可能となりましたが、今回の提携は特別です。Fireworks が独占的な推論プロバイダーとなり、API ルーターを介さずに直接モデルを実行します。

Qwen 3.7 Plus は「チャットモデル」ではなく「エージェントモデル」として位置づけられています。画像とテキストの両方を理解し、思考モードと非思考モードをサポート、必要に応じて推論を実行できます。コンテキストウィンドウは 262K トークンで、スクリーンショット、ツール呼び出し、キャッシュされたコンテキストを含む長時間のエージェントワークフローに最適です。Fireworks はターン間の思考履歴の保持をサポートしており、reasoning_history="preserved" を設定することで利用できます。

価格面では、Qwen 3.7 Plus のサーバーレス価格は入力 100 万トークンあたり 0.50 ドル、キャッシュ入力は 0.10 ドル、出力は 3.00 ドルです。バッチ処理はさらに 50% 割引され、24 時間以内に結果が得られます。これは前世代の Qwen 3.6 Plus と比較して約 50% の価格低下に相当します。Fireworks は直接推論プロバイダーとして、データ保持ゼロポリシーと 99.9% のアップタイム SLA を約束しています。

ベンチマークでは、Qwen 3.7 Plus は思考モード有効時に AIME 2025 でフラッグシップの Max と同等のスコア（14/15）を達成し、速度は約 3 倍高速です。エンドツーエンドのスループットは Qwen 3.6 Plus 比 3.55 倍向上。コーディングエージェントタスクでは、マルチファイル開発、デバッグ、問題解決ワークフローで優れた性能を示しています。

開発者は Fireworks の Playground、サーバーレス API、または Claude Code や OpenCode などのツールへの統合を通じて利用を開始できます。API は OpenAI および Anthropic 互換形式をサポートしています。Fireworks は Qwen 3.7 Max の早期アクセス申請も受け付けており、要望に応じてファインチューニングサポートも提供します。

Qwen 3.7 Plus の重みはライセンスされており、HuggingFace では公開されていません。Fireworks がこれらの重みを直接ホスティングする唯一の推論プロバイダーです。オープンウェイトモデルを好むユーザー向けに、Fireworks は Qwen 8B などのオープンモデルも同時に提供しています。