AATF – AIエージェントの意思決定理由を記録するオープン仕様
AATFは、AIエージェントの各決定の理由、検討した代替案、自信度、および却下した選択肢を記録するためのオープン仕様とリファレンスSDKです。OpenTelemetryが観測可能性を提供するのに対し、AATFはエージェントの意思決定の説明責任に焦点を当てています。この記事では、コアフォーマット、クイックスタート、既存ツールとの比較、統合、プロジェクトステータスを説明します。
AATF(Agent Audit Trail Format)は、AIエージェントの意思決定プロセスを透明化するためのオープン仕様とリファレンスSDKです。従来のログ記録ツールとは異なり、エージェントが何をしたかではなく、なぜその決定を下したかを記録することに特化しています。このプロジェクトはGitHubリポジトリagent-audit-trailで提供され、MITライセンスの下で公開されており、現在v0.1.0のドラフト段階にあります。
AATFの核となるのはDecisionレコードで、以下のフィールドを含みます:タイプ(例:reasoning)、名前、決定オブジェクト(入力要約、決定内容、推論、信頼度とその根拠)、および検討された代替案(説明、却下理由、スコア)。各ステップにはSHA-256ハッシュチェーンが付与され、改ざん防止が図られるとともに、PII(個人識別情報)編集機能が組み込まれています。
クイックスタートは数行のPythonコードで完了します:AuditSessionを作成し、決定と代替案を含む推論ステップを追加するだけです。例えば、ユーザーが天気情報を要求した場合、エージェントは「天気APIを使用する」「記憶から回答する」「明確化を求める」などの選択肢から選び、その理由と信頼度が記録されます。
AATFが特に強調する3つの特徴は次の通りです:1)alternatives_considered — エージェントが選ばなかった選択肢をリストアップすることを強制し、決定が後付けの合理化でないことを証明する。2)confidence + confidence_basis — 数値的な信頼度とその決定方法を記録し、監査者が「事実に基づく95%の確信」と「感覚的な95%の確信」を区別できるようにする。3)confidence_trajectory — 意思決定チェーン全体での信頼度の変化を追跡し、情報収集に伴う確実性の増減を明らかにする。
既存ツールとの比較:ブロックチェーン台帳は不変性のために行動を保存するが、AATFはフォーマットに依存しない。LangChainコールバックはフレームワーク固有のトレースであり、AATFはフレームワークに依存せずCrewAIやAutoGenなどと連携可能。MCP監査ツールはツール呼び出しのみを監査するが、AATFは選択理由まで深掘りする。一般的なログ(structlogなど)はキー・バリューのイベントログだが、AATFは意思決定の推論に特化した構造化データを提供する。
統合方法は多様:LangChin用のコールバックハンドラ、OpenAI用のラッパー、汎用デコレータを通じて、さまざまなフレームワークで利用可能。インストールは簡単で、外部依存関係はゼロ、Python 3.10以上、標準ライブラリのみ700行で構成されています。
プロジェクトステータス:仕様v0.1.0完成、リファレンスSDKは134のテストがパスし、PII編集(電子メール、電話番号)、ハッシュチェーン完全性検証、JSON/CSV/HTMLエクスポートをサポート。今後の計画として、PII編集の拡張(クレジットカード、SSNなど)、TypeScript/JavaScript SDKの開発、コミュニティRFCプロセスの開始、LangChain/CrewAI公式プラグインのリリースが予定されています。
このプロジェクトは、エージェント開発者、コンプライアンス担当者、CISO(最高情報セキュリティ責任者)、研究者を対象としています。エージェントの推論品質の証明、意思決定障害のデバッグ、EU AI ActやGDPR、SOC2要件に対応した機械可読な監査証跡の提供、そしてエージェント推論パターンや決定木の研究に役立ちます。
AATFはコミュニティ主導のプロジェクトであり、仕様の読解、イシューの提起、統合の構築、情報の拡散など、あらゆる貢献を歓迎しています。基本理念は「エージェントが思考できるなら、その思考は監査可能であるべき」というものです。