Runcap:我构建了一个本地成本上限工具,用于AI编码代理
Runcap 是一个免费、本地的 CLI 工具,用于在运行 AI 编码代理之前估算成本,并强制执行硬性支出上限。它提供成本估算、运行时上限强制、令牌压缩以及代理卡住时的救援提示。与现有的事后观察工具不同,Runcap 像断路器一样防止超支。
Runcap 是一款专为 AI 编码代理设计的本地成本管理工具,旨在解决多代理运行时的高额 token 消耗和不可预测的账单问题。与现有的可观察性工具(如 Langfuse、Helicone)不同,它们只能在事后显示费用,而 Runcap 在运行前估算成本范围,并在运行中强制执行硬性上限,确保不会出现意外超支。
Runcap 的核心功能包括成本估算、硬性上限、令牌压缩和卡住时的救援提示。它通过一个本地网关工作,所有代理的 API 调用都会经过该网关,从而在到达付费提供商之前进行定价和限制。开发者只需配置自己的 API 密钥(OpenAI 或 Anthropic),并拥有自己的代理(如 Claude Code 或 Codex),即可在一条命令内完成成本控制。
具体命令方面,runcap preflight 可以评估请求的广度和风险,runcap run 可封装任何代理或命令,并在卡住时生成救援提示。runcap gateway 启动一个本地代理,记录实时 token 使用量,并基于定价表计算成本,一旦达到每日上限,后续调用将返回 429 状态码,从而阻止更多费用产生。
令牌压缩功能内置于网关中,无需额外依赖。它通过重新序列化 JSON、折叠长日志和堆栈跟踪,以及压缩尾部空白,无损地减少 token 使用量,从而进一步降低成本。仪表盘会显示节省的金额和压缩的 token 数量。
Runcap 的定价表基于多提供商数据,涵盖 Anthropic 和 OpenAI 的多种模型,并处理缓存读取和批量折扣。当模型未知时,会明确标记为 unknown_price,而非猜测。信任模型方面,每个重要输出都带有标签,如 observed(观察)、calculated(计算)、provider_usage(提供商用量)等,如果无法证明,则明确声明 unknown。
Runcap 的核心功能完全免费,采用 MIT 许可,代码和 token 永不离开本地。付费层级(Pro、Team)提供云同步、托管仪表盘、团队协作等高级功能,但本地核心功能永久免费。目前 Runcap 已可用于封装真实的 Codex、Claude 和 Cursor 会话,检测卡住的代理,并提供救援提示,显著节省时间。未来计划包括云平台和更广泛的可观测性集成。