AI News HubLIVE
站内改写

データ過多から実用的なインサイトへ:Verizon Connectが10万人のユーザーにエージェンティックAIを展開した方法

Verizon ConnectはAWS上にエージェンティックAIソリューションを構築し、毎日5億のデータポイントを10万人のユーザー向けの実用的なインサイトに変換しています。この記事では、サーバーレスの異常検出、Strands Agentsによる動的推論、Amazon Nova Liteによる入力トークンコスト70%削減など、アーキテクチャの決定、実装の課題、測定可能な結果について詳しく説明します。

記事インテリジェンス

エンジニア中級

要点

  • エージェンティックAIが120万台の車両からの毎日5億データポイントを処理し、10万人のユーザーに提供。
  • サーバーレス統計モデルで異常検出を行い、LLMが生の表形式データを処理する問題を回避。
  • 2段階のエージェントアーキテクチャ:サマリー生成(集約と優先順位付け)と、ツールベースの詳細調査。
  • Amazon Nova Liteにより、Claude Haikuと比較して入力トークンコストを70%削減しつつ品質を維持。

重要な理由

このニュースが重要なのは、エージェンティックAIが120万台の車両からの毎日5億データポイントを処理し、10万人のユーザーに提供ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

Verizon Connectは、グローバルなフリート管理ソリューションプロバイダーであり、Revealプラットフォームを通じて毎日1.2億以上のアクティブな車両サブスクリプションから5億のデータポイントを処理しています。このデータ量は80,000のユニークなデータ指標に及び、フリートマネージャーは手動分析で重要なパターンを特定することが困難でした。そこでVerizon Connectは、従来の静的ダッシュボードやルールベースの自動化システムではなく、エージェンティックAI(Agentic AI)を採用しました。これは動的に新しいパターンを調査し、発見に基づいて分析を適応させるため、フリート運用の予測不可能な性質に適しています。

**スケーラブルなアーキテクチャ** ソリューションは、異常検出、リクエストの並列化、インサイト生成エンジン、ストレージの4つのコンポーネントで構成されています。ワークフローは毎日のトリガーで開始され、まずAWS Step FunctionsとLambdaを使用したサーバーレス統計モデルが構造化データに対して異常検出を行います。このモデルは数値計算に特化しており、大規模な生の表形式データをLLMに処理させる一般的な落とし穴を回避します。検出された異常は専用テーブルに書き込まれ、その後AIエージェントが起動されます。

AIエージェントには、Strands Agents(オープンソースSDK)が使用され、サーバーレスLambda環境で実行されます。エージェントは動的推論ループを通じて自律的に調査経路を決定し、固定された手順には従いません。S3から事前計算された異常を取得し、Amazon Auroraから追加コンテキスト、DynamoDBから過去のインサイトをクエリし、最終的なインサイトをS3に書き戻します。

**2段階のエージェントアーキテクチャ** 第1段階:サマリー生成(異常の集約と優先順位付け)。エージェントは生の異常セットを受け取り、LLMが自律的に共通の根本原因、時間的相関、カテゴリ的類似性などに基づいて異常を集約します。集約後、重大度、再発性、フリート全体への影響、実行可能性などの要素に基づいて関連性スコアを割り当て、上位4つのインサイトを詳細生成に進めます。

第2段階:ツールベースの詳細調査。各サマリーインサイトに対して独立したエージェントインスタンスが生成され、データ取得ツールにアクセスします。エージェントはどのツールをどの順序で何回呼び出すかを自律的に決定し、十分な証拠を収集するまで反復します。例えば、フリート全体で急ブレーキイベントが30%増加した場合、エージェントは自動的に過去30日間の履歴平均を取得し、特定の日に集中していることを発見し、さらに該当する車両とドライバーを特定します。

**コスト最適化とモデル選択** 初期段階ではClaude Sonnetを使用してロジックとインサイト品質を検証し、その後よりコスト効率の高いClaude Haikuに移行しました。最終的には、入力トークンコストをClaude Haiku比で70%削減するAmazon Nova Liteを採用しました。このワークロードは入力トークン(テレマティクスデータ、異常、コンテキスト)が大半を占めるため、この削減は重要です。品質は自動テストスイートとゴールドスタンダードデータセットによって維持されました。すべてのLLMはAmazon Bedrockを通じてホストされています。

**同時実行管理** 10万人のユーザーに午前8時ETまでにインサイトを提供するため、Amazon SQSを使用してLambdaの最大同時実行数を制御し、API需要のスパイクを平滑化し、Bedrockのクォータ(TPMおよびRPM)内に収めます。例えば、4時間のインサイト生成ウィンドウ内で、1,500 RPMのレートであれば約1.25時間で処理が完了します。

生成されたインサイトは、Revealのライブマップ上の専用パネルに表示され、ユーザーはクリックして詳細な分析を確認できます。このソリューションは、受動的なデータスクリーニングを能動的なインテリジェンスに変え、フリート管理の効率を大幅に向上させます。