AI News HubLIVE
站內改寫1 分鐘閱讀

AgentWatch:運行時預算強制,防止AI代理失控

AgentWatch 是一項邊緣服務,通過強制會話預算、檢測循環和提供可配置的故障轉移來防止 AI 代理無限運行。集成只需更改基礎 URL 並組合密鑰,無需 SDK。支持 OpenAI、Anthropic 等主要提供商。提供免費、專業和企業層級。

來源Hacker News AI作者: Mohil_Sharma

AgentWatch 是一項新興的邊緣服務,旨在為企業提供對 AI 代理的完全控制,防止它們因無限循環或意外高消耗而燒掉預算。該服務充當應用程序與大型語言模型(LLM)提供商(如 OpenAI、Anthropic、Groq 等)之間的代理,在每個 API 調用發送到提供商之前進行同步預算檢查。如果會話已超過其設定的美元上限,AgentWatch 會返回 HTTP 402 狀態碼並阻止該調用,整個過程在邊緣以毫秒級延遲完成。

集成 AgentWatch 非常簡單:開發者只需將 OpenAI 或 Anthropic 客户端的 base URL 更改為 https://api.agent-watch.dev/v1/proxy/openai,並將 AgentWatch 令牌與 API 密鑰以冒號分隔組合即可。無需安裝 SDK 或庫,無需修改現有代碼。該服務還支持通過環境變量在平台級別(如 Vercel、AWS、Fly.io)進行配置,從而實現公司政策的強制執行。

除了預算強制,AgentWatch 還提供一系列治理功能:會話級預算(而非按請求計費)允許代理進行數百次調用而不超支;循環檢測功能可捕獲遞歸模式並在上下文呈指數級增長時發送 Slack 警報;可配置的故障轉移選項允許企業選擇“故障開放”(AgentWatch 出現問題時請求正常進行)或“故障關閉”(嚴格停止以保證預算)。此外,AgentWatch 承諾零數據保留,從不存儲提示或完成內容,僅保留元數據(如令牌數、延遲和成本)。企業計劃還包括 SOC 2 合規導出、SLA 監控和歐盟數據駐留。

定價方面,AgentWatch 提供免費層(每月 50,000 次請求,含完整預算強制和基本儀表板),專業層(每月 99 美元,50 萬次請求,添加高級分析、邊緣提示緩存、提供商故障轉移和 Slack 警報),以及企業層(自定義定價,無限請求,99.9% SLA,SSO,專用客户經理)。該服務目前正處於早期訪問階段,使用代碼“PH50”可享受前 50 名客户的限時優惠。