オブザーバビリティの未来は単一のプロプライエタリAIエージェントではなく、チームが構築する何千ものエージェントになる
この記事は、オブザーバビリティが単一の普遍的なAIエージェントに収束するのではなく、チーム固有の特殊なエージェントが多数存在するようになると主張し、コンテキスト、オープン性、共有調査成果物の重要性を強調しています。
現在、多くのオブザーバビリティベンダーは、単一のSREエージェントを統合プラットフォームに組み込み、テレメトリを理解し、質問に答え、本番環境の問題を修正するという未来に賭けています。しかし、このビジョンは狭すぎます。実際のデバッグはチームごとに異なります。データベースチーム、フロントエンドチーム、決済チーム、インフラチームは、それぞれ異なる方法で問題を調査します。したがって、オブザーバビリティの未来は単一のプロプライエタリエージェントではなく、各チームによって構築される何千もの特殊なエージェントになると考えられます。
AIモデルの進歩により、エージェントはオブザーバビリティの新しいインターフェースになりつつあります。人間→ダッシュボード→データという従来のパターンから、人間→エージェント→データへと移行しています。エンジニアはチャートやクエリに直接触れる代わりに、エージェントが自動的にクエリを実行し、結果を要約し、仮説を生成します。DoorDashのAnil K氏は、エンジニアがSlackでログリンクではなくAIによる調査結果を共有するようになったと報告しています。
エージェントの導入は、オブザーバビリティのワークロードの性質を変えます。人間の調査者は限られた数のダッシュボードやクエリしか扱えませんが、エージェントは同時に多くの仮説を検証できます。これにより、クエリ数が非線形的に増加し、API層やストレージに高い負荷がかかります。また、エージェントの推論はデータの完全性に依存するため、過去のデータが破棄されたりサンプリングされたりすると、重要な証拠が欠落する可能性があります。
多くの企業は「普遍的なSREエージェント」に投資していますが、デバッグの難しい部分はコンテキストです。調査の次のステップは、オブザーバビリティプラットフォーム内のテレメトリだけでなく、チームの運用方法、信頼するシグナル、過去の障害、内部ドキュメント、Slackスレッドなど、さまざまな場所に分散したコンテキストに依存します。RingCentralのSushant Hiray氏は、チーム内の暗黙知が文書化されておらず、エージェントがデータなしで幻覚を起こすと指摘しています。
したがって、オブザーバビリティは、インフラ、データベース、セキュリティ、決済などのドメインに特化したエージェントのエコシステムへと進化するでしょう。各エージェントは、組織のランブック、ドキュメント、業務ロジックに基づいて構築されます。この未来にはオープン性が不可欠です。単なるオープンソースではなく、各階層のツール(モデル、ツールチェーン、ワークフロー、インターフェース)を自由に選択できることが重要です。エージェントは既存のシステムに適応すべきであり、その逆ではありません。
チームが独自のエージェントを構築しても、コラボレーションの問題が残ります。調査結果は一時的なチャットセッションに留まるべきではなく、クエリ、証拠、結論を記録した永続的な成果物が必要です。これらの成果物は人間だけでなく、将来のエージェントが過去の調査から学習するためにも役立ちます。したがって、人間とエージェントが協力して調査を共有、レビュー、改善できる永続的な調査プラットフォームが求められます。
最後に、人間は依然としてコントロールプレーンに留まります。エージェントは証拠を収集し仮説を検証するのに優れていますが、ビジネス上の優先順位を理解し、リスクを評価し、意思決定を行う能力はまだ持ち合わせていません。これらの判断は、システムを運用する人間の責任です。将来的にはエージェント間の協調も考えられますが、現時点では人間の判断が不可欠です。