AI News HubLIVE
站內改寫2 分鐘閱讀

MCP工具:捕獲AI代理範圍蔓延

Overreach 是一款獨立的 MCP 工具,用於檢測 AI 代理生成的代碼差異是否超出用户提示指定的範圍。它通過三個階段:LLM 範圍提取、確定性差異解析和比較,標記未授權的依賴、環境變量、端點、定時任務等。支持多種 LLM 提供商,無需 API 密鑰時自動進入偏執模式。提供 CLI、MCP 服務器、預提交鈎子和 CI 門控功能,幫助開發者確保 AI 代理行為可控。

來源Hacker News AI作者: Naveja

Overreach 是一款創新的開源工具,專門用於檢測 AI 編碼代理的範圍蔓延問題。當開發者向 AI 代理提供提示並生成代碼差異時,Overreach 能夠自動判斷該差異是否嚴格遵循了原始提示的要求,還是代理悄悄添加了未授權的修改,例如新的端點、依賴項、環境變量或定時任務。

該工具的核心工作流程分為三個階段。第一階段是範圍提取,利用 LLM(如 Anthropic 的 Claude 或 OpenAI 的 GPT)解析用户提示,生成一份授權的範圍 JSON,明確指出了哪些文件、功能、依賴、端點、環境變量和行為是用户實際要求的。此階段是唯一調用模型的環節。第二階段是差異解析,通過確定性正則表達式解析代碼差異,提取實際添加的內容。第三階段是比較階段,使用集合運算和模糊匹配找出實際添加與授權範圍之間的差異,從而產生髮現項。這種設計使得後兩個階段無需調用模型,確保了工具的可審計性和測試的零成本。

Overreach 對發現項進行了分類和嚴重性分級。例如,環境變量、端點和定時任務被視為高風險;依賴項和文件修改為中風險;新功能為低風險。最終的綜合得分根據最高風險項確定:高風險為 HIGH,中風險為 MEDIUM,低風險為 LOW。這種分級有助於開發者優先處理關鍵問題。

在部署方面,Overreach 提供了多種集成方式。CLI 工具可以直接運行手動檢查,支持管道輸入差異。MCP 服務器可與 Claude Code、Cursor、Codex 等主流工具無縫集成,自動暴露檢查功能。預提交鈎子可以在代碼提交前攔截高風險的範圍蔓延,阻止提交併輸出錯誤信息。CI 門控則可以在 GitHub Actions 中運行,確保每次拉取請求都經過檢查,失敗則阻止合併。

Overreach 的設計充分考慮了靈活性。它支持 Anthropic、OpenAI(包括兼容服務如 OpenRouter、Groq)、Ollama 等多種 LLM 提供商,用户可以根據自己的環境選擇最合適的模型。此外,如果沒有 API 密鑰,工具會自動進入偏執模式,基於正則表達式解析提示,標記所有差異中的內容為潛在未授權,雖然理解力不如 LLM,但仍能提供基本保障。

該項目完全開源,採用 MIT 許可證。它不自帶遙測或回傳功能,完全在本地運行,保護用户隱私。Overreach 的文檔完善,包括詳細的安裝指南、使用示例、常見問題解答以及一個零密鑰的演示命令,方便用户快速體驗。通過社區反饋和問題跟蹤,工具持續改進,確保準確性和實用性。