AI News HubLIVE
站內改寫2 分鐘閱讀

ANMA:通過邊界合約降低AI編碼代理成本

ANMA是一款開源工具,通過純YAML模塊合約生成CLAUDE.md、掛鈎和CI檢查,強制AI編碼代理(如Claude Code)遵守架構邊界。基準測試表明,對於廉價模型(Claude Haiku 4.5),它能將邊界違規率從68%降至0%,同時為前沿模型提供額外保障。支持Python、Go、TypeScript,輕量級設計(約800行代碼),並提供企業級功能如漂移檢測和增量採用。

來源Hacker News AI作者: nxy

ANMA Labs 近日發佈了 ANMA,一款旨在降低 AI 編碼代理成本並增強架構合規性的開源工具。該工具通過簡單的 YAML 格式模塊合約,自動生成針對 AI 代理(如 Claude Code)的指導文件和強制檢查,確保代碼修改始終保持在預定義的架構邊界內。

ANMA 的核心設計圍繞兩個層面:指導與強制。指導層通過生成根目錄和每個模塊的 CLAUDE.md 以及 .claude/rules 文件,將架構信息注入代理的上下文,從而引導其行為。強制層則通過預工具使用掛鈎(PreToolUse hook)在實際編輯之前攔截違規操作,並在預提交和 CI 中同步執行檢查。這種雙重機制在不同場景下各司其職。

最引人注目的是 ANMA 的基準測試結果。在一個受控的 Python 實驗中,使用較便宜且速度較快的模型 Claude Haiku 4.5 時,未經 ANMA 輔助的項目在 19 次運行中有 13 次違反了聲明的模塊邊界;而使用 ANMA 後,20 次運行中違規次數降為零(Fisher 精確檢驗 p<0.0001)。不過,研究也誠實指出,對於前沿模型(如 Opus 4.8),ANMA 的引導作用有限——該模型本身就能很好地遵守邊界。因此,ANMA 的核心價值在於為廉價代理提供保險,併為企業提供 CI/治理保證,而非提高前沿模型的智能水平。

ANMA 目前支持 Python、Go 和 TypeScript 三種語言。Python 版本同時實現了接口強制(通過 public: 字段)和模塊依賴檢查;Go 和 TypeScript 版本則專注於模塊間的依賴關係驗證。所有語言的後端均經過驗證,可在實際項目中有效阻斷跨模塊違規。值得注意的是,TypeScript 和 Go 的基準測試也顯示出顯著效果,但 Go 的對照率低於預註冊門檻,因此其結果被視為“提示性”而非確定性。

使用 ANMA 非常簡單:通過 pip install anma[tach] 安裝後,運行 anma init 即可生成合約框架和示例,anma sync 會生成所有工件(CLAUDE.md、掛鈎、CI 配置等),anma check 可立即驗證邊界是否被遵守。該工具設計輕量,核心代碼僅約 800 行,除了 PyYAML 外無強制運行時依賴,可選的後端如 tach(Python)、go-arch-lint(Go)和 dependency-cruiser(TypeScript)可提供更快的檢查速度。

ANMA 還提供了一系列企業級功能:漂移檢測(確保生成的文檔與合約同步)、增量採用(通過 --warn 模式和 deprecated_deps 字段允許漸進步署)、治理支持(模塊所有者自動生成 CODEOWNERS)以及供應鏈安全保障(簽名版本、SBOM 等)。

總的來説,ANMA 為運行廉價 AI 代理的團隊提供了一種經濟高效的架構保護方案,同時也為任何需要強制架構合規性的項目提供了可靠的工具。對於完全依賴前沿模型處理小規模任務的團隊,ANMA 可能價值有限——但它的設計本身也承認了這一點。