Compass:为AI编码代理提供护栏与硬性预算上限
Compass 是一个本地优先的配置层,专为 Claude Code、Codex 和 Gemini 设计,能够强制实施预算上限、阻止危险命令并通过评分系统确保护栏策略的有效性。它提供自动化的 PR 循环,可自我修复,并支持可验证的供应链安全。安装简单,无需 telemetry,且始终由你决定合并。
Compass 是一个面向 AI 编码代理的本地优先配置层,旨在解决三个关键问题:预算失控、不安全命令和未经验证的代码合并。它适用于 Claude Code、Codex 和 Gemini 等主流 AI 编码工具,通过简单的环境变量设置即可实现硬性预算上限。例如,设置 COMPASS_MAX_USD=5 后,会话在达到 5 美元时立即停止,而非仅仅发出警告。这种强制停止机制避免了因代理长时间运行而产生的高额费用。
在安全方面,Compass 提供了经过评分验证的护栏策略。其内置的护栏系统能够阻止灾难性命令(如 rm -rf /)和密钥写入操作,并通过 CI 中的评估集进行评分,确保达到 100/100 的精确率和召回率。红队测试功能进一步检验了代理对提示注入、CLAUDE.md 投毒、本地安全覆盖等攻击的抵抗能力,且可选将告警升级到托管护栏服务(如 webhook、Bedrock、Azure)。
成本优化是 Compass 的另一大亮点。其成本路由模块根据任务复杂度自动选择合适模型:复杂任务(如重新设计认证模型)分配给 Opus,简单任务(如修复拼写错误)分配给 Haiku。在评估集上,这种路由策略相比全 Opus 方案节省约 61% 成本,同时保持约 98% 的质量。路由结果同样在 CI 中持续评估。
Compass 的自主 PR 循环是其最引人注目的功能之一。当开发人员打开一个 PR 时,Compass 会自动进行审查、安全扫描、运行测试,并使用第二个模型进行交叉审计。如果发现问题,它会自动推送修复,直到所有检查通过,然后等待人工合并。这种迭代式工作流可应用于单次 PR,也可扩展至整个代码仓库群,实现夜间自动处理。
安装方式灵活多样:支持 Homebrew、Git 克隆、Claude Code 插件市场以及手动安装,所有方法均可逆且可固定版本。配置文件和插件清单通过符号链接保持同步,一次更新即可应用到所有代理。安装后无需 API 密钥即可使用本地功能,包括护栏、子代理和 CLI 工具。
Compass 还提供了丰富的 CLI 命令,如 compass bench(运行评估)、compass route(查看模型选择)、compass redteam(执行红队测试)、compass spend(管理预算)和 compass verify(验证软件供应链完整性)。所有功能均无遥测,完全本地运行,确保数据隐私。
总的来说,Compass 通过硬性预算上限、可量化的安全护栏、成本感知的路由策略以及自动化 PR 循环,为 AI 编码代理提供了可信任的配置层。其核心思想是通过迭代(而非一次性的猜测)来保证质量,所有循环最终都止于人工决策,确保开发者始终掌握合并权。