Compass – AIコーディングエージェントのためのガードレールと厳格な予算上限
Compass は Claude Code、Codex、Gemini 向けのローカルファースト設定レイヤーで、厳格な予算上限を強制し、危険なコマンドをブロックし、CI で評価されるガードレールを提供します。自動 PR ループがレビューと修正を自律的に行い、Opus のみと比較して約 61% のコスト削減を実現するルーティングも特長です。サプライチェーンは SLSA 証明書で検証可能です。
Compass は、Claude Code、Codex、Gemini などの AI コーディングエージェント向けのローカルファースト設定レイヤーです。その主な目的は、予算の超過、危険なコマンドの実行、未検証コードのマージという3つの問題を防ぐことです。環境変数 COMPASS_MAX_USD を設定するだけで、例えば5ドルに設定すれば、セッションはその金額に達した時点で即座に停止し、単なる警告ではなく強制的に遮断されます。これにより、エージェントが長時間稼働して高額な費用が発生するのを防ぎます。
セキュリティ面では、Compass は評価ゲートされたガードレールを提供します。rm -rf / のような壊滅的なコマンドや機密情報の書き込みを事前にブロックし、CI 上で100/100の精度と再現率を達成しています。レッドチームテスト機能により、プロンプトインジェクション、CLAUDE.md の改ざん、ローカルセキュリティの回避などに対する耐性も検証可能で、必要に応じてウェブフック、Bedrock、Azure などの管理ガードレールサービスにエスカレーションできます。
コスト最適化も重要な機能です。コストルーターモジュールがタスクの複雑さに基づいて適切なモデルを選択します。認証モデルの再設計のような複雑なタスクは Opus に、タイポ修正のような簡単なタスクは Haiku に振り分けられます。評価セットでは、このルーティング戦略により全 Opus 構成と比較して約61%のコスト削減を実現しつつ、品質は約98%を維持しています。ルーティングの結果も CI で継続的に評価されます。
自律 PR ループは Compass の最も注目すべき機能の一つです。開発者が PR を作成すると、Compass は自動的にレビュー、セキュリティチェック、テスト実行を行い、さらに別のモデルでクロス監査を実施します。問題が見つかれば自動修正をプッシュし、すべてのチェックが通過するまで繰り返します。最終的には人間がマージする判断を下します。この反復的なワークフローは単一の PR に適用できるだけでなく、複数のリポジトリ全体に拡張して夜間に自動実行することも可能です。
インストール方法は柔軟で、Homebrew、Git クローン、Claude Code のプラグインマーケット、手動インストールから選択できます。すべての方法は元に戻すことができ、バージョンを固定できます。設定ファイルとプラグインマニフェストはシンボリックリンクで同期され、一度の更新ですべてのエージェントに適用されます。インストール後に API キーは不要で、ローカル機能(ガードレール、サブエージェント、CLI ツール)をすぐに利用できます。
Compass はまた、compass bench(評価の実行)、compass route(モデル選択の確認)、compass redteam(レッドチームテストの実行)、compass spend(予算管理)、compass verify(ソフトウェアサプライチェーンの検証)などの豊富な CLI コマンドを提供します。すべての機能はテレメトリなしで完全にローカルで動作し、データプライバシーを確保します。
総じて、Compass は厳格な予算上限、定量化可能なセキュリティガードレール、コストを意識したルーティング戦略、自動化された PR ループを通じて、AI コーディングエージェントに信頼できる設定レイヤーを提供します。その中核となる考え方は、一回の推測ではなく反復によって品質を高めることであり、すべてのループは最終的に人間の判断で終了し、開発者が常にマージの決定権を持ちます。