AI News HubLIVE
サイト内リライト3 分で読了

Innovative Solutions、Fireworks AI でエンタープライズサービスの提供を再構築

AWS プレミア パートナーである Innovative Solutions は、推論レイヤーを Fireworks AI に移行することでサービス提供を変革しました。DarcyIQ プラットフォームは社内生産性ツールからマルチエージェント実行システムへと進化し、契約サイクルを 30~45 日から約 3 日に短縮、提供スループットを倍増させ、推論コストを予測可能かつ制御可能にしました。

AWS プレミア パートナーである Innovative Solutions は、毎年数百もの AI 駆動型サービスを提供しています。ビジネスの拡大に伴い、推論コストと提供の複雑さが同時に増加し、構造的な制約となっていました。AI 推論は最大のコスト要因となり、利益率の拡大と運用の柔軟性を制限していました。そこで同社は、中核プラットフォーム DarcyIQ の推論レイヤーを Fireworks AI に移行し、モデル統合のオーバーヘッドを削減、マルチモデルの安定実行とコスト予測可能性を実現しました。これは単なるツールの変更ではなく、サービスエコノミクスの再設計、つまり線形提供から並列・エージェント駆動型実行への移行でした。

DarcyIQ は当初、提案書、技術文書、デリバリー成果物を生成するための社内生産性ツールとして開発されました。エンゲージメント数の増加に伴い、サービスの提供中核実行層へと進化し、後に代理店、GSI、ISV によって使用される商用プラットフォームに拡大しました。CTO の Travis Rehl 氏は、人員増加に比例せずにスループットを向上させるエージェント駆動型提供システムへの移行を主導してきました。

直面した課題は、提供ボトルネック(コンサルタントやエンジニアが複数の案件を同時に管理し、顧客、ツール、モデル間でのコンテキストスイッチングが頻発)、コスト構造の圧力(AI コストは最大の売上原価であり、使用量に比例して増加)、契約サイクルの長期化(初回面談から契約まで30~45日)の3点でした。同社は Baseten などの推論プロバイダーを評価した上で、Fireworks AI を選択しました。その理由は一貫性、つまりモデルを変更しても初回から動作し、チューニングが不要だったからです。Travis 氏は次のように述べています。「Fireworks が勝ったのは、常に一貫して機能したからです。どのモデルをデプロイしても、初回から動作します。チューニングも不要です。それは私たちにとって重要でした。なぜなら、私たちは常にモデルを変更するからです。」移行後、約90%の推論支出が1.5週間以内に Fireworks に移行しました。

新しいアーキテクチャの下で、DarcyIQ はマルチエージェント実行システムへと進化しました。1) リアルタイム契約・スコープ生成:顧客との会話を構造化スコープ、提案書、契約書に直接変換し、契約サイクルを約3日に短縮。2) 継続的スコーピングインテリジェンス:各エンゲージメントからのデータを将来の実行にフィードバック。3) 自動成果物生成:テンプレートとビジネスロジックを使用して契約書や提案書を自動生成。4) マルチエージェントによる並列実行:プロジェクトあたり6~10のエージェントが並行して作業し、エンジニアあたりのプロジェクト容量を2~4件から約10件に増加、スループットを2~3倍向上。

結果として、契約サイクルは30~45日から3日に短縮、エンジニアとPMのスループットは倍増、推論コストは線形増加から予測可能・制御可能へと変化、月間トークン使用量は40~100億に達し毎月倍増しています。最も重要なのは、提供が線形プロセスから並列実行システムへと変わったことです。

今後、DarcyIQ は継続的に稼働するシステムとなり、数千のエージェントが並行して実行されます。これにより、中核的な制約はモデル能力から、持続的なエージェントワークロードの単位経済へと移行します。Travis 氏は「マルチエージェントシステムの単位経済に多くの時間を費やしています。Fireworks のおかげで、新しいエージェント機能が市場に出てくるたびに、顧客向けの価格モデルを迅速に更新・改善する柔軟性が得られました」と述べています。Fireworks AI とのパートナーシップにより、Innovative Solutions は拡大を制限していたインフラと経済的制約を取り除き、新たな運用モデルを実現しました。それは、契約サイクルの圧縮、並列エージェントシステムによる提供、継続的学習によるスコーピングと実行の改善、そして人間のスループットではなく推論効率によって駆動される単位経済です。