2026-06-06 01:27 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Runcap：我構建了一個本地成本上限工具，用於AI編碼代理

Runcap 是一個免費、本地的 CLI 工具，用於在運行 AI 編碼代理之前估算成本，並強制執行硬性支出上限。它提供成本估算、運行時上限強制、令牌壓縮以及代理卡住時的救援提示。與現有的事後觀察工具不同，Runcap 像斷路器一樣防止超支。

來源Hacker News AI作者: kirillAIsolo

Runcap 是一款專為 AI 編碼代理設計的本地成本管理工具，旨在解決多代理運行時的高額 token 消耗和不可預測的賬單問題。與現有的可觀察性工具（如 Langfuse、Helicone）不同，它們只能在事後顯示費用，而 Runcap 在運行前估算成本範圍，並在運行中強制執行硬性上限，確保不會出現意外超支。

Runcap 的核心功能包括成本估算、硬性上限、令牌壓縮和卡住時的救援提示。它通過一個本地網關工作，所有代理的 API 調用都會經過該網關，從而在到達付費提供商之前進行定價和限制。開發者只需配置自己的 API 密鑰（OpenAI 或 Anthropic），並擁有自己的代理（如 Claude Code 或 Codex），即可在一條命令內完成成本控制。

具體命令方面，runcap preflight 可以評估請求的廣度和風險，runcap run 可封裝任何代理或命令，並在卡住時生成救援提示。runcap gateway 啓動一個本地代理，記錄實時 token 使用量，並基於定價表計算成本，一旦達到每日上限，後續調用將返回 429 狀態碼，從而阻止更多費用產生。

令牌壓縮功能內置於網關中，無需額外依賴。它通過重新序列化 JSON、摺疊長日誌和堆棧跟蹤，以及壓縮尾部空白，無損地減少 token 使用量，從而進一步降低成本。儀表盤會顯示節省的金額和壓縮的 token 數量。

Runcap 的定價表基於多提供商數據，涵蓋 Anthropic 和 OpenAI 的多種模型，並處理緩存讀取和批量折扣。當模型未知時，會明確標記為 unknown_price，而非猜測。信任模型方面，每個重要輸出都帶有標籤，如 observed（觀察）、calculated（計算）、provider_usage（提供商用量）等，如果無法證明，則明確聲明 unknown。

Runcap 的核心功能完全免費，採用 MIT 許可，代碼和 token 永不離開本地。付費層級（Pro、Team）提供雲同步、託管儀表盤、團隊協作等高級功能，但本地核心功能永久免費。目前 Runcap 已可用於封裝真實的 Codex、Claude 和 Cursor 會話，檢測卡住的代理，並提供救援提示，顯著節省時間。未來計劃包括雲平台和更廣泛的可觀測性集成。