AI News HubLIVE
站內改寫1 分鐘閱讀

AgentWatch:執行時預算強制,防止AI代理失控

AgentWatch 是一項邊緣服務,透過強制會話預算、檢測迴圈和提供可配置的故障轉移來防止 AI 代理無限執行。整合只需更改基礎 URL 並組合金鑰,無需 SDK。支援 OpenAI、Anthropic 等主要提供商。提供免費、專業和企業層級。

來源Hacker News AI作者: Mohil_Sharma

AgentWatch 是一項新興的邊緣服務,旨在為企業提供對 AI 代理的完全控制,防止它們因無限迴圈或意外高消耗而燒掉預算。該服務充當應用程式與大型語言模型(LLM)提供商(如 OpenAI、Anthropic、Groq 等)之間的代理,在每個 API 呼叫傳送到提供商之前進行同步預算檢查。如果會話已超過其設定的美元上限,AgentWatch 會返回 HTTP 402 狀態碼並阻止該呼叫,整個過程在邊緣以毫秒級延遲完成。

整合 AgentWatch 非常簡單:開發者只需將 OpenAI 或 Anthropic 客戶端的 base URL 更改為 https://api.agent-watch.dev/v1/proxy/openai,並將 AgentWatch 令牌與 API 金鑰以冒號分隔組合即可。無需安裝 SDK 或庫,無需修改現有程式碼。該服務還支援透過環境變數在平臺級別(如 Vercel、AWS、Fly.io)進行配置,從而實現公司政策的強制執行。

除了預算強制,AgentWatch 還提供一系列治理功能:會話級預算(而非按請求計費)允許代理進行數百次呼叫而不超支;迴圈檢測功能可捕獲遞迴模式並在上下文呈指數級增長時傳送 Slack 警報;可配置的故障轉移選項允許企業選擇“故障開放”(AgentWatch 出現問題時請求正常進行)或“故障關閉”(嚴格停止以保證預算)。此外,AgentWatch 承諾零資料保留,從不儲存提示或完成內容,僅保留後設資料(如令牌數、延遲和成本)。企業計劃還包括 SOC 2 合規匯出、SLA 監控和歐盟資料駐留。

定價方面,AgentWatch 提供免費層(每月 50,000 次請求,含完整預算強制和基本儀表板),專業層(每月 99 美元,50 萬次請求,新增高階分析、邊緣提示快取、提供商故障轉移和 Slack 警報),以及企業層(自定義定價,無限請求,99.9% SLA,SSO,專用客戶經理)。該服務目前正處於早期訪問階段,使用程式碼“PH50”可享受前 50 名客戶的限時優惠。

AgentWatch:執行時預算強制,防止AI代理失控 | AI News Hub