2026-06-20 20:51 UTC+9サイト内リライト2 分で読了更新: 2026-06-22 08:31 UTC+9

AIエージェントのスコープクリープを検出するMCPツール

Overreach は、AIコーディングエージェントが生成したコード差分がユーザーのプロンプトで指定された範囲を超えているかを検出するスタンドアロンMCPツールです。LLMベースのスコープ抽出、決定論的な差分解析、比較の3段階で動作し、未承認の依存関係、環境変数、エンドポイント、cronジョブなどをフラグ付けします。複数のLLMプロバイダをサポートし、APIキーなしではパラノイドモードで動作。CLI、MCPサーバー、プリコミットフック、CIゲートを提供し、開発ワークフローに簡単に組み込めます。

ソースHacker News AI著者: Naveja

記事インテリジェンス

エンジニア中級

要点

Overreach はユーザーのプロンプトとコード差分を比較し、AIエージェントによる不正な変更を特定します。
依存関係、環境変数、エンドポイント、cronジョブ、ファイル、機能などのカテゴリをチェックし、重大度を割り当てます。
Anthropic、OpenAI、OllamaなどのLLMプロバイダをサポートし、APIキーなしでもパラノイドモードで実行可能。
CLI、MCPサーバー統合、プリコミットフック、CIゲートを提供し、ワークフローに簡単に組み込めます。

重要な理由

このニュースが重要なのは、Overreach はユーザーのプロンプトとコード差分を比較し、AIエージェントによる不正な変更を特定しますためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Overreach は、AIコーディングエージェントのスコープクリープ問題に対処するための革新的なオープンソースツールです。開発者がAIエージェントにプロンプトを送り、コード差分が生成されたとき、Overreach はその差分が元のプロンプトの要件を厳密に守っているか、それともエージェントがこっそりと不正な変更（新しいエンドポイント、依存関係、環境変数、cronジョブなど）を追加したかを自動的に判断します。

このツールのコアワークフローは3つの段階に分かれています。第1段階はスコープ抽出で、LLM（AnthropicのClaudeやOpenAIのGPTなど）を使用してユーザーのプロンプトを解析し、どのファイル、機能、依存関係、エンドポイント、環境変数、動作が実際に要求されたかを示す許可されたスコープJSONを生成します。この段階のみがモデルを呼び出します。第2段階は差分解析で、決定論的な正規表現を使用してコード差分を解析し、実際に追加された内容を抽出します。第3段階は比較で、集合演算とあいまいマッチングを使用して、実際の追加内容と許可されたスコープの差分を計算し、結果を出力します。この設計により、後半の2段階はモデル呼び出しを必要とせず、ツールの監査可能性とテストのゼロコストを実現しています。

Overreach は発見項目をカテゴリと重大度で分類します。例えば、環境変数、エンドポイント、cronジョブは高リスク、依存関係とファイル変更は中リスク、新しい機能は低リスクです。最終的なスコープクリープスコアは、最も高いリスク項目に基づいてHIGH、MEDIUM、LOWと判定されます。この階層化により、開発者は重要な問題に優先的に対処できます。

導入面では、Overreach は複数の統合方法を提供します。CLIツールは手動検査に使用でき、パイプで差分を入力できます。MCPサーバーはClaude Code、Cursor、Codexなどの主要なツールとシームレスに統合し、自動的に検査機能を公開します。プリコミットフックはコードコミット前に高リスクのスコープクリープをブロックし、エラーを出力します。CIゲートはGitHub Actionsで動作し、プルリクエストごとに検査を実行し、失敗するとマージを阻止します。

Overreach の設計は柔軟性を重視しています。Anthropic、OpenAI（OpenRouter、Groqなどの互換サービスを含む）、Ollamaなど複数のLLMプロバイダをサポートし、ユーザーは環境に最適なモデルを選択できます。APIキーがない場合、ツールは自動的にパラノイドモードに移行し、正規表現ベースでプロンプトを解析して差分内のすべてを潜在的未承認としてマークします。LLMほどの理解力はありませんが、基本的な保護を提供します。

このプロジェクトは完全にオープンソースで、MITライセンスの下で公開されています。テレメトリやコールホーム機能はなく、完全にローカルで動作し、ユーザーのプライバシーを保護します。ドキュメントも充実しており、詳細なインストールガイド、使用例、FAQ、およびキー不要のデモコマンドが含まれているため、ユーザーはすぐに体験できます。コミュニティからのフィードバックと問題追跡を通じて、ツールは継続的に改善され、正確性と実用性が確保されています。