ANMA:安価なAIコーディングエージェントのための境界契約
ANMAは、プレーンYAMLのモジュール契約からCLAUDE.md、フック、CIチェックを生成し、AIコーディングエージェント(Claude Codeなど)をアーキテクチャ境界内に強制するオープンソースツールです。ベンチマークでは、安価なモデル(Haiku 4.5)の違反率を68%から0%に低減し、フロンティアモデルには保険を提供します。Python、Go、TypeScriptをサポートし、軽量設計(約800行)で、ドリフト検出や段階的導入などのエンタープライズ機能を備えています。
ANMA Labs は、AI コーディングエージェントのコストを削減し、アーキテクチャのコンプライアンスを強化するためのオープンソースツール ANMA を公開しました。このツールは、シンプルな YAML 形式のモジュール契約を使用して、Claude Code などの AI エージェント向けのガイドファイルと強制チェックを自動生成し、コード変更が常に定義されたアーキテクチャ境界内に収まるようにします。
ANMA の中心的な設計は、ガイダンスと強制の 2 つの層に基づいています。ガイダンス層では、ルートおよびモジュールごとの CLAUDE.md と .claude/rules ファイルを生成し、アーキテクチャ情報をエージェントのコンテキストに注入して行動を誘導します。強制層では、PreToolUse フックが実際の編集前に違反を阻止し、pre-commit と CI でも同期してチェックを実行します。この二重のメカニズムは、それぞれ異なるシナリオで機能します。
最も注目すべきは ANMA のベンチマーク結果です。制御された Python 実験では、安価で高速なモデル Claude Haiku 4.5 を使用した場合、ANMA なしのプロジェクトでは 19 回中 13 回が宣言されたモジュール境界に違反しましたが、ANMA を使用した場合、20 回の実行で違反はゼロになりました(Fisher 正確検定 p<0.0001)。ただし、研究では正直に、フロンティアモデル(Opus 4.8 など)の場合、ANMA のガイダンス効果は限定的であり、モデル自体が境界を適切に守ることを指摘しています。したがって、ANMA の主な価値は、安価なエージェントに対する保険と、CI/ガバナンス保証を企業に提供することであり、フロンティアモデルの知能を向上させることではありません。
ANMA は現在、Python、Go、TypeScript の 3 言語をサポートしています。Python バージョンは、インターフェース強制(public: フィールド経由)とモジュール依存関係チェックの両方を実装しています。Go と TypeScript バージョンは、モジュール間の依存関係検証に重点を置いています。すべての言語のバックエンドは検証済みで、実際のプロジェクトでクロスモジュール違反を効果的にブロックできます。注目すべき点として、TypeScript と Go のベンチマークでも顕著な効果が示されていますが、Go の対照率が事前登録された閾値を下回ったため、結果は「示唆的」であり決定的ではないと報告されています。
ANMA の使用は非常に簡単です。pip install anma[tach] でインストール後、anma init で契約のスケルトンとサンプルを生成し、anma sync ですべての成果物(CLAUDE.md、フック、CI 設定など)を生成、anma check で即座に境界が遵守されているかを検証できます。このツールは軽量設計で、コアコードはわずか約 800 行、PyYAML 以外に必須のランタイム依存関係はなく、tach(Python)、go-arch-lint(Go)、dependency-cruiser(TypeScript)などのオプションのバックエンドを使用するとより高速なチェックが可能です。
ANMA はさらに、ドリフト検出(生成されたドキュメントと契約の同期を維持)、段階的導入(--warn モードと deprecated_deps フィールドによる段階的な展開)、ガバナンスサポート(モジュール所有者から CODEOWNERS を自動生成)、サプライチェーンセキュリティ(署名付きリリース、SBOM など)などのエンタープライズ機能を提供します。
全体として、ANMA は安価な AI エージェントを運用するチームにコスト効率の高いアーキテクチャ保護を提供すると同時に、アーキテクチャのコンプライアンスを強制する必要があるあらゆるプロジェクトに信頼性の高いツールを提供します。小規模タスクのためにフロンティアモデルに完全に依存しているチームにとっては、ANMA の価値は限定的かもしれませんが、その設計自体がそれを認めています。