AI News HubLIVE
サイト内リライト2 分で読了

AgentWatch:ランタイム予算執行でAIエージェントの暴走を防ぐ

AgentWatchは、セッション予算の執行、ループ検出、構成可能なフェイルオーバーにより、AIエージェントの暴走を防ぐエッジサービスです。統合はベースURLの変更とキーの結合だけで、SDKは不要。OpenAI、Anthropicなどの主要プロバイダーをサポート。無料、プロ、エンタープライズの各プランを提供。

ソースHacker News AI著者: Mohil_Sharma

AgentWatchは、企業がAIエージェントを完全に制御できるようにする新しいエッジサービスです。このサービスは、アプリケーションとOpenAI、Anthropic、GroqなどのLLMプロバイダーとの間でプロキシとして機能し、各API呼び出しがプロバイダーに送信される前に同期予算チェックを実行します。セッションが設定されたドル上限を超えた場合、AgentWatchはHTTP 402ステータスコードを返して呼び出しをブロックします。このプロセスはエッジでミリ秒単位のレイテンシで完了します。

AgentWatchの統合は非常に簡単です。開発者はOpenAIまたはAnthropicクライアントのベースURLをhttps://api.agent-watch.dev/v1/proxy/openaiに変更し、AgentWatchトークンとAPIキーをコロンで区切って結合するだけです。SDKやライブラリのインストールは不要で、既存のコードを変更する必要もありません。このサービスは、Vercel、AWS、Fly.ioなどのプラットフォームレベルで環境変数を介して構成することもでき、企業ポリシーの強制を可能にします。

予算執行に加えて、AgentWatchはセッションレベルの予算(リクエストごとではなく、エージェントが数百回の呼び出しを行っても予算を超えないようにする)、ループ検出(再帰パターンを捕捉し、コンテキストが指数関数的に増加した場合にSlackアラートを送信)、構成可能なフェイルオーバー(AgentWatchがダウンした場合にリクエストを通常通り処理する「フェイルオープン」と、予算を厳格に守る「フェイルクローズ」の選択)などのガバナンス機能を提供します。また、AgentWatchはゼロデータ保持を約束し、プロンプトや完了内容を一切保存せず、トークン数、レイテンシ、コストなどのメタデータのみを保持します。エンタープライズプランにはSOC 2コンプライアンスエクスポート、SLA監視、EUデータレジデンシーも含まれます。

価格設定は、無料プラン(月5万リクエスト、完全な予算執行と基本ダッシュボード付き)、プロプラン(月99ドル、50万リクエスト、高度な分析、エッジプロンプトキャッシング、プロバイダーフェイルオーバー、Slackアラート)、エンタープライズプラン(カスタム価格、無制限リクエスト、99.9% SLA、SSO、専任アカウントマネージャー)となっています。現在、早期アクセス中で、コード「PH50」を使用すると先着50名の顧客が限定割引を受けられます。

AgentWatch:ランタイム予算執行でAIエージェントの暴走を防ぐ | AI News Hub