2026-06-06 02:27 UTC+9サイト内リライト2 分で読了更新: 2026-06-30 22:03 UTC+9

Runcap：コーディングエージェント向けのローカルコスト上限ツールを構築しました

Runcap は、AI コーディングエージェントの実行コストを事前に見積もり、ハードな支出上限を強制する無料のローカル CLI ツールです。コスト見積もり、実行中の上限適用、トークン圧縮、エージェントがスタックしたときのレスキュー機能を提供します。事後的にコストを追跡する既存の可観測性ツールとは異なり、Runcap は回路ブレーカーのように過剰支出を防ぎます。

ソースHacker News AI著者: kirillAIsolo

Runcap は、AI コーディングエージェントの実行コストを管理するために設計されたローカルツールです。マルチエージェント実行は大量のトークンを消費し、コストが予測不能になる問題を解決します。既存の可観測性ツール（Langfuse、Helicone など）は事後的にコストを表示するだけですが、Runcap は実行前にコスト範囲を見積もり、実行中にハードな上限を強制することで、予期せぬ超過を防ぎます。

Runcap の主な機能には、コスト見積もり、ハード上限、トークン圧縮、スタック時のレスキューが含まれます。ローカルゲートウェイとして動作し、エージェントの API 呼び出しをすべて通過させることで、有料プロバイダに到達する前に価格設定と制限を行います。開発者は自身の API キー（OpenAI または Anthropic）とエージェント（Claude Code や Codex など）を用意するだけで、1つのコマンドでコスト管理を実現できます。

具体的なコマンドとしては、runcap preflight がリクエストの広さとリスクを評価し、runcap run が任意のエージェントやコマンドをラップしてスタック時にレスキューを生成します。runcap gateway はローカルプロキシを起動し、リアルタイムでトークン使用量を記録し、価格表に基づいてコストを計算します。デイリー上限に達すると、以降の呼び出しは 429 ステータスコードを返し、それ以上の費用の発生を防ぎます。

トークン圧縮機能はゲートウェイに内蔵されており、追加の依存関係は不要です。JSON の再シリアル化、長いログやスタックトレースの折りたたみ、末尾空白の圧縮により、ロスレスでトークン使用量を削減し、コストをさらに低減します。ダッシュボードには節約額と圧縮されたトークン数が表示されます。

Runcap の価格表は複数のプロバイダ（Anthropic と OpenAI の各種モデル）からのデータに基づき、キャッシュ読み取りやバッチ割引も処理します。モデルが不明な場合は unknown_price と明示され、推測は行われません。信頼モデルでは、すべての重要な出力に observed（観測）、calculated（計算）、provider_usage（プロバイダ使用量）などのラベルが付けられ、証明できない場合は unknown と宣言されます。

Runcap のコア機能は完全に無料で、MIT ライセンスの下で提供され、コードとトークンはローカルから離れることはありません。有料ティア（Pro、Team）はクラウド同期、ホスト型ダッシュボード、チームコラボレーションなどの高度な機能を提供しますが、ローカルコア機能は永久に無料です。現在、Runcap は実際の Codex、Claude、Cursor セッションをラップし、スタックしたエージェントを検出してレスキューを提供することで時間を節約できます。将来の計画には、クラウドプラットフォームとより広範な可観測性統合が含まれています。