AI News HubLIVE
站内改写2 分で読了

Runcap:コーディングエージェント向けのローカルコスト上限ツールを構築しました

Runcap は、AI コーディングエージェントの実行コストを事前に見積もり、ハードな支出上限を強制する無料のローカル CLI ツールです。コスト見積もり、実行中の上限適用、トークン圧縮、エージェントがスタックしたときのレスキュー機能を提供します。事後的にコストを追跡する既存の可観測性ツールとは異なり、Runcap は回路ブレーカーのように過剰支出を防ぎます。

ソースHacker News AI著者: kirillAIsolo

Runcap は、AI コーディングエージェントの実行コストを管理するために設計されたローカルツールです。マルチエージェント実行は大量のトークンを消費し、コストが予測不能になる問題を解決します。既存の可観測性ツール(Langfuse、Helicone など)は事後的にコストを表示するだけですが、Runcap は実行前にコスト範囲を見積もり、実行中にハードな上限を強制することで、予期せぬ超過を防ぎます。

Runcap の主な機能には、コスト見積もり、ハード上限、トークン圧縮、スタック時のレスキューが含まれます。ローカルゲートウェイとして動作し、エージェントの API 呼び出しをすべて通過させることで、有料プロバイダに到達する前に価格設定と制限を行います。開発者は自身の API キー(OpenAI または Anthropic)とエージェント(Claude Code や Codex など)を用意するだけで、1つのコマンドでコスト管理を実現できます。

具体的なコマンドとしては、runcap preflight がリクエストの広さとリスクを評価し、runcap run が任意のエージェントやコマンドをラップしてスタック時にレスキューを生成します。runcap gateway はローカルプロキシを起動し、リアルタイムでトークン使用量を記録し、価格表に基づいてコストを計算します。デイリー上限に達すると、以降の呼び出しは 429 ステータスコードを返し、それ以上の費用の発生を防ぎます。

トークン圧縮機能はゲートウェイに内蔵されており、追加の依存関係は不要です。JSON の再シリアル化、長いログやスタックトレースの折りたたみ、末尾空白の圧縮により、ロスレスでトークン使用量を削減し、コストをさらに低減します。ダッシュボードには節約額と圧縮されたトークン数が表示されます。

Runcap の価格表は複数のプロバイダ(Anthropic と OpenAI の各種モデル)からのデータに基づき、キャッシュ読み取りやバッチ割引も処理します。モデルが不明な場合は unknown_price と明示され、推測は行われません。信頼モデルでは、すべての重要な出力に observed(観測)、calculated(計算)、provider_usage(プロバイダ使用量)などのラベルが付けられ、証明できない場合は unknown と宣言されます。

Runcap のコア機能は完全に無料で、MIT ライセンスの下で提供され、コードとトークンはローカルから離れることはありません。有料ティア(Pro、Team)はクラウド同期、ホスト型ダッシュボード、チームコラボレーションなどの高度な機能を提供しますが、ローカルコア機能は永久に無料です。現在、Runcap は実際の Codex、Claude、Cursor セッションをラップし、スタックしたエージェントを検出してレスキューを提供することで時間を節約できます。将来の計画には、クラウドプラットフォームとより広範な可観測性統合が含まれています。