AI News HubLIVE
サイト内リライト2 分で読了

金融コンプライアンスのための本番級AIエージェント:Stripeからの教訓

Stripeは年間1.4兆ドルの決済量を50カ国で処理し、Amazon Bedrock上のReActエージェントフレームワークを使用して、人間の監視を維持しながらレビュー処理時間を26%削減しました。本記事では、タスク分解、オーケストレーションパターン、プロンプトキャッシングによるコスト最適化を含む技術アーキテクチャ、インフラストラクチャの決定、および学んだ教訓を紹介します。

ソースAWS Machine Learning Blog著者: Christopher Phillippi

Stripeは、グローバルな決済インフラストラクチャのリーダーとして、年間約1.4兆ドルの取扱高を50カ国で処理しており、これは世界のGDPの約1.3%に相当します。この規模は大きなコンプライアンスの課題をもたらします。毎日数千件の取引を審査する必要があり、熟練したアナリストは最大80%の時間を断片的なシステムからの書類収集に費やし、価値の高いリスク評価に十分な時間を割けていませんでした。

この問題に対処するため、StripeはAWS上でAmazon Bedrockを基盤にした本番級のAIエージェントシステムを構築しました。このシステムはReAct(推論と行動)エージェントフレームワークを採用し、複雑なコンプライアンスレビューを複数の構成可能なサブタスクに分解します。各サブタスクは有向非巡回グラフ(DAG)として配置され、エージェントが特定の問題に集中できるようにするとともに、審査の網羅性と監査可能性を確保します。Stripeのコンプライアンス審査は、監督と説明責任、透明性、効率性の三本柱に基づいています。監督と説明責任では、人間が常に主導権を握り、設定可能な承認ワークフローと多層的な意思決定チェックポイントを設けています。透明性では、すべてのアクション、決定、理由を不変の監査証跡として記録します。効率性では、事前調査と動的分析により、より迅速で深い審査を実現します。

実際の運用では、AIエージェントは最終決定を下すのではなく、人間のレビュー担当者に事前調査の結果を提供します。レビュー担当者はツール上で各サブ質問に回答し、エージェントの回答は補足情報として活用されますが、最終的な決定権は人間にあります。この設計により、96%以上の有用性評価を達成しつつ、必要な監督と説明責任を維持しています。

ReActフレームワークでは、エージェントは思考の後にツールを呼び出してデータを取得し、その観測結果を処理します。これは閉ループ制御メカニズムを形成し、幻覚や推論の逸脱を防ぎます。長いコンテキストに対処するため、Stripeはサブタスク分解によってインタラクションの回数を制限し、Amazon Bedrockのプロンプトキャッシングを利用して入力トークンコストを削減しています。

技術アーキテクチャにおいて、Stripeはエージェントロジックを処理する専用のエージェントサービスを構築しました。これは従来の機械学習推論エンジンとは異なり、エージェントアプリケーションは主にネットワーク待機型であり、モデル応答やツール呼び出しを待つため、計算集約型ではありません。さらに、StripeはLLMプロキシマイクロサービスを開発し、統一API、モデルフォールバック、モニタリング機能を提供することで、複数チーム間のリソース競合を回避しています。LLMプロキシは、ノイジーネイバー問題を解決し、単一APIで複数のモデルにアクセス可能にし、自動フォールバックをサポートします。

システムは当初わずか数エージェントから始まり、1年足らずで100以上のエージェントに成長し、多様なコンプライアンスシナリオをカバーしています。Stripeの経験は、適切なタスク分解、人間の監視、専用インフラストラクチャにより、AIエージェントが品質と監査可能性を損なうことなくコンプライアンス業務を拡大できることを示しています。このアプローチは、金融業界が直面する2060億ドルのコンプライアンス負担に対処するための道筋を提供しています。