AI News HubLIVE
站內改寫2 分鐘閱讀

ANMA:透過邊界合約降低AI編碼代理成本

ANMA是一款開源工具,透過純YAML模組合約生成CLAUDE.md、掛鉤和CI檢查,強制AI編碼代理(如Claude Code)遵守架構邊界。基準測試表明,對於廉價模型(Claude Haiku 4.5),它能將邊界違規率從68%降至0%,同時為前沿模型提供額外保障。支援Python、Go、TypeScript,輕量級設計(約800行程式碼),並提供企業級功能如漂移檢測和增量採用。

來源Hacker News AI作者: nxy

ANMA Labs 近日釋出了 ANMA,一款旨在降低 AI 編碼代理成本並增強架構合規性的開源工具。該工具透過簡單的 YAML 格式模組合約,自動生成針對 AI 代理(如 Claude Code)的指導檔案和強制檢查,確保程式碼修改始終保持在預定義的架構邊界內。

ANMA 的核心設計圍繞兩個層面:指導與強制。指導層透過生成根目錄和每個模組的 CLAUDE.md 以及 .claude/rules 檔案,將架構資訊注入代理的上下文,從而引導其行為。強制層則透過預工具使用掛鉤(PreToolUse hook)在實際編輯之前攔截違規操作,並在預提交和 CI 中同步執行檢查。這種雙重機制在不同場景下各司其職。

最引人注目的是 ANMA 的基準測試結果。在一個受控的 Python 實驗中,使用較便宜且速度較快的模型 Claude Haiku 4.5 時,未經 ANMA 輔助的專案在 19 次執行中有 13 次違反了宣告的模組邊界;而使用 ANMA 後,20 次執行中違規次數降為零(Fisher 精確檢驗 p<0.0001)。不過,研究也誠實指出,對於前沿模型(如 Opus 4.8),ANMA 的引導作用有限——該模型本身就能很好地遵守邊界。因此,ANMA 的核心價值在於為廉價代理提供保險,併為企業提供 CI/治理保證,而非提高前沿模型的智慧水平。

ANMA 目前支援 Python、Go 和 TypeScript 三種語言。Python 版本同時實現了介面強制(透過 public: 欄位)和模組依賴檢查;Go 和 TypeScript 版本則專注於模組間的依賴關係驗證。所有語言的後端均經過驗證,可在實際專案中有效阻斷跨模組違規。值得注意的是,TypeScript 和 Go 的基準測試也顯示出顯著效果,但 Go 的對照率低於預註冊門檻,因此其結果被視為“提示性”而非確定性。

使用 ANMA 非常簡單:透過 pip install anma[tach] 安裝後,執行 anma init 即可生成合約框架和示例,anma sync 會生成所有工件(CLAUDE.md、掛鉤、CI 配置等),anma check 可立即驗證邊界是否被遵守。該工具設計輕量,核心程式碼僅約 800 行,除了 PyYAML 外無強制執行時依賴,可選的後端如 tach(Python)、go-arch-lint(Go)和 dependency-cruiser(TypeScript)可提供更快的檢查速度。

ANMA 還提供了一系列企業級功能:漂移檢測(確保生成的文件與合約同步)、增量採用(透過 --warn 模式和 deprecated_deps 欄位允許漸進步署)、治理支援(模組所有者自動生成 CODEOWNERS)以及供應鏈安全保障(簽名版本、SBOM 等)。

總的來說,ANMA 為執行廉價 AI 代理的團隊提供了一種經濟高效的架構保護方案,同時也為任何需要強制架構合規性的專案提供了可靠的工具。對於完全依賴前沿模型處理小規模任務的團隊,ANMA 可能價值有限——但它的設計本身也承認了這一點。