AI News HubLIVE
サイト内リライト2 分で読了

Fireworks AI が Microsoft Foundry に対応、Azure で最高クラスのオープンモデル推論を提供

Fireworks AI は Microsoft Foundry 上でのパブリックプレビューを発表し、高性能なオープンモデル推論を Azure に統合します。DeepSeek V3.2、Kimi K2.5 などの最先端モデルをワンストップで利用可能にし、BYOW と柔軟な価格設定をサポートします。

Fireworks AI は本日、Microsoft Foundry 上での Fireworks on Microsoft Foundry のパブリックプレビューを発表しました。これにより、同社の高性能オープンモデル推論が Azure に直接統合されます。本パートナーシップは、Fireworks の高速推論と最先端のオープンモデルを統一された Microsoft Foundry プラットフォームに統合し、開発者がモデル評価から本番展開までをシームレスに行える環境を提供します。

企業が AI デプロイの制御、コスト効率、セキュリティに対する要求を高める中、オープンモデルは標準化の選択肢として注目されています。Fireworks と Microsoft Foundry の連携は、モデル評価の迅速化、信頼性のある実行、大規模推論の最適化といった課題を解決し、カスタムサーバースタック構築によるイノベーションの遅延を防ぎます。

Fireworks on Foundry では、DeepSeek V3.2、Kimi K2.5、MiniMax M2.5、GLM-5、GPT-OSS 120B などのオープンモデルに即座にアクセス可能です。Fireworks の推論エンジンはすでにインターネット規模で稼働しており、毎日13兆以上のトークンを処理、約18万リクエスト/秒を維持し、大規模モデルで1000トークン/秒以上の生成速度を実現しています。このパフォーマンスが Microsoft Foundry でネイティブに利用できるようになりました。

主な機能には、最新オープンモデルへのデイゼロアクセス、独自の重みを持ち込める BYOW、推論時の品質・レイテンシ・コストの最適化、Serverless 従量課金または予約済みスループットユニットの柔軟な価格設定が含まれます。すべての操作は Azure のエンタープライズガバナンスフレームワークのもとで行われ、セキュリティとコンプライアンスが確保されます。

この連携はすでに実際のインパクトを生み出しており、デジタルネイティブ企業や従来型企業が制御力を維持しながら AI アプリケーションを迅速に展開するのに役立っています。今後、Fireworks は Foundry 内でモデル微調整機能を提供し、オープンソースモデルのカスタマイズとデプロイのためのエンドツーエンドのプラットフォームを目指します。開発者は Microsoft Foundry モデルカタログの Serverless エンドポイントを通じて今すぐ利用開始できます。