2026-06-06 01:27 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Runcap：我构建了一个本地成本上限工具，用于AI编码代理

Runcap 是一个免费、本地的 CLI 工具，用于在运行 AI 编码代理之前估算成本，并强制执行硬性支出上限。它提供成本估算、运行时上限强制、令牌压缩以及代理卡住时的救援提示。与现有的事后观察工具不同，Runcap 像断路器一样防止超支。

来源Hacker News AI作者: kirillAIsolo

Runcap 是一款专为 AI 编码代理设计的本地成本管理工具，旨在解决多代理运行时的高额 token 消耗和不可预测的账单问题。与现有的可观察性工具（如 Langfuse、Helicone）不同，它们只能在事后显示费用，而 Runcap 在运行前估算成本范围，并在运行中强制执行硬性上限，确保不会出现意外超支。

Runcap 的核心功能包括成本估算、硬性上限、令牌压缩和卡住时的救援提示。它通过一个本地网关工作，所有代理的 API 调用都会经过该网关，从而在到达付费提供商之前进行定价和限制。开发者只需配置自己的 API 密钥（OpenAI 或 Anthropic），并拥有自己的代理（如 Claude Code 或 Codex），即可在一条命令内完成成本控制。

具体命令方面，runcap preflight 可以评估请求的广度和风险，runcap run 可封装任何代理或命令，并在卡住时生成救援提示。runcap gateway 启动一个本地代理，记录实时 token 使用量，并基于定价表计算成本，一旦达到每日上限，后续调用将返回 429 状态码，从而阻止更多费用产生。

令牌压缩功能内置于网关中，无需额外依赖。它通过重新序列化 JSON、折叠长日志和堆栈跟踪，以及压缩尾部空白，无损地减少 token 使用量，从而进一步降低成本。仪表盘会显示节省的金额和压缩的 token 数量。

Runcap 的定价表基于多提供商数据，涵盖 Anthropic 和 OpenAI 的多种模型，并处理缓存读取和批量折扣。当模型未知时，会明确标记为 unknown_price，而非猜测。信任模型方面，每个重要输出都带有标签，如 observed（观察）、calculated（计算）、provider_usage（提供商用量）等，如果无法证明，则明确声明 unknown。

Runcap 的核心功能完全免费，采用 MIT 许可，代码和 token 永不离开本地。付费层级（Pro、Team）提供云同步、托管仪表盘、团队协作等高级功能，但本地核心功能永久免费。目前 Runcap 已可用于封装真实的 Codex、Claude 和 Cursor 会话，检测卡住的代理，并提供救援提示，显著节省时间。未来计划包括云平台和更广泛的可观测性集成。