AI News HubLIVE
站内改写1 分钟阅读

AgentWatch:运行时预算强制,防止AI代理失控

AgentWatch 是一项边缘服务,通过强制会话预算、检测循环和提供可配置的故障转移来防止 AI 代理无限运行。集成只需更改基础 URL 并组合密钥,无需 SDK。支持 OpenAI、Anthropic 等主要提供商。提供免费、专业和企业层级。

来源Hacker News AI作者: Mohil_Sharma

AgentWatch 是一项新兴的边缘服务,旨在为企业提供对 AI 代理的完全控制,防止它们因无限循环或意外高消耗而烧掉预算。该服务充当应用程序与大型语言模型(LLM)提供商(如 OpenAI、Anthropic、Groq 等)之间的代理,在每个 API 调用发送到提供商之前进行同步预算检查。如果会话已超过其设定的美元上限,AgentWatch 会返回 HTTP 402 状态码并阻止该调用,整个过程在边缘以毫秒级延迟完成。

集成 AgentWatch 非常简单:开发者只需将 OpenAI 或 Anthropic 客户端的 base URL 更改为 https://api.agent-watch.dev/v1/proxy/openai,并将 AgentWatch 令牌与 API 密钥以冒号分隔组合即可。无需安装 SDK 或库,无需修改现有代码。该服务还支持通过环境变量在平台级别(如 Vercel、AWS、Fly.io)进行配置,从而实现公司政策的强制执行。

除了预算强制,AgentWatch 还提供一系列治理功能:会话级预算(而非按请求计费)允许代理进行数百次调用而不超支;循环检测功能可捕获递归模式并在上下文呈指数级增长时发送 Slack 警报;可配置的故障转移选项允许企业选择“故障开放”(AgentWatch 出现问题时请求正常进行)或“故障关闭”(严格停止以保证预算)。此外,AgentWatch 承诺零数据保留,从不存储提示或完成内容,仅保留元数据(如令牌数、延迟和成本)。企业计划还包括 SOC 2 合规导出、SLA 监控和欧盟数据驻留。

定价方面,AgentWatch 提供免费层(每月 50,000 次请求,含完整预算强制和基本仪表板),专业层(每月 99 美元,50 万次请求,添加高级分析、边缘提示缓存、提供商故障转移和 Slack 警报),以及企业层(自定义定价,无限请求,99.9% SLA,SSO,专用客户经理)。该服务目前正处于早期访问阶段,使用代码“PH50”可享受前 50 名客户的限时优惠。

AgentWatch:运行时预算强制,防止AI代理失控 | AI News Hub