AI News HubLIVE
站内改写1 分鐘閱讀

Runcap:我構建了一個本地成本上限工具,用於AI編碼代理

Runcap 是一個免費、本地的 CLI 工具,用於在運行 AI 編碼代理之前估算成本,並強制執行硬性支出上限。它提供成本估算、運行時上限強制、令牌壓縮以及代理卡住時的救援提示。與現有的事後觀察工具不同,Runcap 像斷路器一樣防止超支。

來源Hacker News AI作者: kirillAIsolo

Runcap 是一款專為 AI 編碼代理設計的本地成本管理工具,旨在解決多代理運行時的高額 token 消耗和不可預測的賬單問題。與現有的可觀察性工具(如 Langfuse、Helicone)不同,它們只能在事後顯示費用,而 Runcap 在運行前估算成本範圍,並在運行中強制執行硬性上限,確保不會出現意外超支。

Runcap 的核心功能包括成本估算、硬性上限、令牌壓縮和卡住時的救援提示。它通過一個本地網關工作,所有代理的 API 調用都會經過該網關,從而在到達付費提供商之前進行定價和限制。開發者只需配置自己的 API 密鑰(OpenAI 或 Anthropic),並擁有自己的代理(如 Claude Code 或 Codex),即可在一條命令內完成成本控制。

具體命令方面,runcap preflight 可以評估請求的廣度和風險,runcap run 可封裝任何代理或命令,並在卡住時生成救援提示。runcap gateway 啓動一個本地代理,記錄實時 token 使用量,並基於定價表計算成本,一旦達到每日上限,後續調用將返回 429 狀態碼,從而阻止更多費用產生。

令牌壓縮功能內置於網關中,無需額外依賴。它通過重新序列化 JSON、摺疊長日誌和堆棧跟蹤,以及壓縮尾部空白,無損地減少 token 使用量,從而進一步降低成本。儀表盤會顯示節省的金額和壓縮的 token 數量。

Runcap 的定價表基於多提供商數據,涵蓋 Anthropic 和 OpenAI 的多種模型,並處理緩存讀取和批量折扣。當模型未知時,會明確標記為 unknown_price,而非猜測。信任模型方面,每個重要輸出都帶有標籤,如 observed(觀察)、calculated(計算)、provider_usage(提供商用量)等,如果無法證明,則明確聲明 unknown。

Runcap 的核心功能完全免費,採用 MIT 許可,代碼和 token 永不離開本地。付費層級(Pro、Team)提供雲同步、託管儀表盤、團隊協作等高級功能,但本地核心功能永久免費。目前 Runcap 已可用於封裝真實的 Codex、Claude 和 Cursor 會話,檢測卡住的代理,並提供救援提示,顯著節省時間。未來計劃包括雲平台和更廣泛的可觀測性集成。