AI News HubLIVE
站內改寫2 分鐘閱讀

Compass:為AI編碼代理提供護欄與硬性預算上限

Compass 是一個本地優先的配置層,專為 Claude Code、Codex 和 Gemini 設計,能夠強制實施預算上限、阻止危險命令並透過評分系統確保護欄策略的有效性。它提供自動化的 PR 迴圈,可自我修復,並支援可驗證的供應鏈安全。安裝簡單,無需 telemetry,且始終由你決定合併。

來源Hacker News AI作者: chandu1221

Compass 是一個面向 AI 編碼代理的本地優先配置層,旨在解決三個關鍵問題:預算失控、不安全命令和未經驗證的程式碼合併。它適用於 Claude Code、Codex 和 Gemini 等主流 AI 編碼工具,透過簡單的環境變數設定即可實現硬性預算上限。例如,設定 COMPASS_MAX_USD=5 後,會話在達到 5 美元時立即停止,而非僅僅發出警告。這種強制停止機制避免了因代理長時間執行而產生的高額費用。

在安全方面,Compass 提供了經過評分驗證的護欄策略。其內建的護欄系統能夠阻止災難性命令(如 rm -rf /)和金鑰寫入操作,並透過 CI 中的評估集進行評分,確保達到 100/100 的精確率和召回率。紅隊測試功能進一步檢驗了代理對提示注入、CLAUDE.md 投毒、本地安全覆蓋等攻擊的抵抗能力,且可選將告警升級到託管護欄服務(如 webhook、Bedrock、Azure)。

成本最佳化是 Compass 的另一大亮點。其成本路由模組根據任務複雜度自動選擇合適模型:複雜任務(如重新設計認證模型)分配給 Opus,簡單任務(如修復拼寫錯誤)分配給 Haiku。在評估集上,這種路由策略相比全 Opus 方案節省約 61% 成本,同時保持約 98% 的質量。路由結果同樣在 CI 中持續評估。

Compass 的自主 PR 迴圈是其最引人注目的功能之一。當開發人員開啟一個 PR 時,Compass 會自動進行審查、安全掃描、執行測試,並使用第二個模型進行交叉審計。如果發現問題,它會自動推送修復,直到所有檢查透過,然後等待人工合併。這種迭代式工作流可應用於單次 PR,也可擴充套件至整個程式碼倉庫群,實現夜間自動處理。

安裝方式靈活多樣:支援 Homebrew、Git 克隆、Claude Code 外掛市場以及手動安裝,所有方法均可逆且可固定版本。配置檔案和外掛清單透過符號連結保持同步,一次更新即可應用到所有代理。安裝後無需 API 金鑰即可使用本地功能,包括護欄、子代理和 CLI 工具。

Compass 還提供了豐富的 CLI 命令,如 compass bench(執行評估)、compass route(檢視模型選擇)、compass redteam(執行紅隊測試)、compass spend(管理預算)和 compass verify(驗證軟體供應鏈完整性)。所有功能均無遙測,完全本地執行,確保資料隱私。

總的來說,Compass 透過硬性預算上限、可量化的安全護欄、成本感知的路由策略以及自動化 PR 迴圈,為 AI 編碼代理提供了可信任的配置層。其核心思想是透過迭代(而非一次性的猜測)來保證質量,所有迴圈最終都止於人工決策,確保開發者始終掌握合併權。