2026-05-15 11:30 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

Fireworks AI が Microsoft Foundry に対応、Azure で最高クラスのオープンモデル推論を提供

Fireworks AI は Microsoft Foundry 上でのパブリックプレビューを発表し、高性能なオープンモデル推論を Azure に統合します。DeepSeek V3.2、Kimi K2.5 などの最先端モデルをワンストップで利用可能にし、BYOW と柔軟な価格設定をサポートします。

ソースFireworks AI Blog

記事インテリジェンス

エンジニア中級

要点

Fireworks AI が Microsoft Foundry 上でパブリックプレビューを開始、Azure に高速オープンモデル推論をもたらす。
DeepSeek V3.2、Kimi K2.5、MiniMax M2.5 などのモデルが利用可能で、BYOW に対応。
日々13兆以上のトークンを処理し、約18万リクエスト/秒を維持するエンタープライズグレードのサービス。

重要な理由

このニュースが重要なのは、Fireworks AI が Microsoft Foundry 上でパブリックプレビューを開始、Azure に高速オープンモデル推論をもたらすためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Fireworks AI は本日、Microsoft Foundry 上での Fireworks on Microsoft Foundry のパブリックプレビューを発表しました。これにより、同社の高性能オープンモデル推論が Azure に直接統合されます。本パートナーシップは、Fireworks の高速推論と最先端のオープンモデルを統一された Microsoft Foundry プラットフォームに統合し、開発者がモデル評価から本番展開までをシームレスに行える環境を提供します。

企業が AI デプロイの制御、コスト効率、セキュリティに対する要求を高める中、オープンモデルは標準化の選択肢として注目されています。Fireworks と Microsoft Foundry の連携は、モデル評価の迅速化、信頼性のある実行、大規模推論の最適化といった課題を解決し、カスタムサーバースタック構築によるイノベーションの遅延を防ぎます。

Fireworks on Foundry では、DeepSeek V3.2、Kimi K2.5、MiniMax M2.5、GLM-5、GPT-OSS 120B などのオープンモデルに即座にアクセス可能です。Fireworks の推論エンジンはすでにインターネット規模で稼働しており、毎日13兆以上のトークンを処理、約18万リクエスト/秒を維持し、大規模モデルで1000トークン/秒以上の生成速度を実現しています。このパフォーマンスが Microsoft Foundry でネイティブに利用できるようになりました。

主な機能には、最新オープンモデルへのデイゼロアクセス、独自の重みを持ち込める BYOW、推論時の品質・レイテンシ・コストの最適化、Serverless 従量課金または予約済みスループットユニットの柔軟な価格設定が含まれます。すべての操作は Azure のエンタープライズガバナンスフレームワークのもとで行われ、セキュリティとコンプライアンスが確保されます。

この連携はすでに実際のインパクトを生み出しており、デジタルネイティブ企業や従来型企業が制御力を維持しながら AI アプリケーションを迅速に展開するのに役立っています。今後、Fireworks は Foundry 内でモデル微調整機能を提供し、オープンソースモデルのカスタマイズとデプロイのためのエンドツーエンドのプラットフォームを目指します。開発者は Microsoft Foundry モデルカタログの Serverless エンドポイントを通じて今すぐ利用開始できます。