Fireworks AI、Hathoraを買収しグローバルコンピュートオーケストレーションを加速
Fireworks AIは、ゲーム向け低遅延コンテナオーケストレーションに特化したHathoraを買収しました。そのリアルタイム・マルチリージョン最適化技術をAI推論に適用し、推論速度と信頼性の向上を目指します。
2026年3月8日、Fireworks AIは、低遅延リアルタイムワークロード向けグローバルコンテナオーケストレーションプラットフォームを構築するHathoraの買収を発表しました。この買収は、Fireworks AIのAI推論インフラストラクチャを加速する重要な一歩です。
Fireworks AIの共同創業者兼CEOであるLin Qiao氏は次のように述べています。「Hathoraのミリ秒単位とルーティング決定への徹底したこだわりは、まさに最先端のAI推論に必要な規律です。」同氏は、AI時代において速度はオプションではなく、生存の条件であると強調しました。
インターネット上で最初のマルチプレイヤーゲームが登場して以来、ラグは敵でした。ゲームでは、ミリ秒が勝敗を決定します。速度は機能ではなく、生存です。AI推論も同じ時代に入りつつあります。それを解決するには、システム、パフォーマンス、そしてグローバルスケールでの信頼性にこだわる特別なチームが必要です。
当初から、Fireworksはエリートインフラエンジニアのチームを構築することを目指してきました。カーネルパフォーマンス、スケジューリング決定、ネットワークパス、そして知能システムを瞬時にする不可視のレイヤーに深く関心を持つ人々です。Hathoraチームはその理念に完全に適合しています。
過去4年間にわたり、Harsh、Sidとそのチームは、レイテンシに敏感なリアルタイムワークロード向けに設計されたグローバルコンテナオーケストレーションプラットフォームを構築しました。そのシステムは、14のリージョン、複数のベアメタルプロバイダー、4つのクラウドにわたってコンテナをルーティングし、マルチプレイヤーゲームに要求されるパフォーマンス保証を実現しています。オーケストレーションが20ミリ秒のレイテンシを追加するだけでも、プレイヤーは即座に気づきます。その規律、すなわちすべてのミリ秒とすべてのルーティング決定への執着は、まさにAI推論に必要なものです。
Hathoraの専門知識により、Fireworksはより高速な推論、よりスマートなルーティング、そしてグローバルに回復力のあるインフラを提供する能力を加速しています。彼らのオーケストレーション技術は、リクエストが最適なGPUに到達する速度と、アプリケーションが実際の需要下でシームレスにスケールする方法を決定するコアレイヤーを強化します。この技術をFireworksの推論クラウドに統合することで、Fireworksを利用したAIアプリケーションの信頼性が向上します。東京でもニューヨークでも、ユーザーは一貫したサブ秒の応答時間を体験できます。これは、リアルタイムでリクエストを最も利用可能な容量に自動ルーティングすることで実現されます。
同様に重要なのは、この買収がFireworksを今後どのように構築していくかを反映していることです。私たちは、スケジューリングアルゴリズム、カーネルバイパスネットワーキング、GPUメモリプレッシャー、配置戦略、障害ドメインを重視する、世界クラスのインフラに情熱を注ぐチームを構築しています。分散システム、ハードウェア、AIモデルが交差する層で働きたいと願うビルダーたちです。ミリ秒が重要となる層です。
次世代のAI製品は、遅いインフラを許容しません。リアルタイムエージェント、マルチモーダルコパイロット、プロダクショングレードの推論システムには、ボトルネックを感じさせないオーケストレーションが必要です。そのためには、レイテンシをバグと見なし、信頼性を当然の前提とするチームが必要です。
世界最速のAI推論プラットフォームを構築し、それを可能にする難しいシステム問題に関心があるなら、私たちは採用を行っています。