AATF – 記錄AI代理決策原因的開放規範
AATF是一個開放規範及參考SDK,用於記錄AI代理的每一步決策,包括考慮的替代方案、置信度以及被拒絕的選擇。它旨在提供決策可審計性,類似於OpenTelemetry的可觀測性,但專注於代理決策的透明度和可問責性。本文介紹了AATF的核心格式、快速上手示例、與其他工具的對比、集成方式以及項目狀態。
AATF(Agent Audit Trail Format)是一個開放規範及其參考SDK,旨在解決AI代理決策透明度的關鍵問題。與傳統的日誌記錄工具不同,AATF專注於記錄代理為什麼做出某個決策,而不是僅僅記錄它做了什麼。它由GitHub倉庫agent-audit-trail提供,採用MIT許可證,目前處於v0.1.0草案階段。
AATF的核心是Decision記錄,它包含以下字段:類型(如reasoning)、名稱、決策對象(包括輸入摘要、決策內容、推理、置信度及其依據)以及考慮的替代方案(包括描述、拒絕原因和分數)。此外,每個步驟帶有SHA-256哈希鏈以確保防篡改,並內置了PII脱敏功能。
快速入門只需幾行Python代碼:創建AuditSession,然後添加推理步驟,其中包含決策和替代方案。例如,當用户請求天氣信息時,代理可以選擇使用天氣API並從記憶回答或請求澄清中決定,系統會記錄每個選擇的理由和置信度。
AATF強調三個其他格式無法捕獲的特性:1)alternatives_considered——強制列出代理未選擇的內容,證明其推理並非事後合理化;2)confidence + confidence_basis——數值置信度及其確定依據,允許審計人員區分基於事實的“95%確信”和主觀的“95%確信”;3)confidence_trajectory——跟蹤整個決策鏈中的置信度變化,揭示代理在信息收集過程中確定性的增減。
與現有工具的比較:區塊鏈賬本關注存儲的不可篡改性,但AATF格式無關;LangChain回調是框架特定的追蹤,而AATF框架無關,可與CrewAI、AutoGen等協同工作;MCP審計工具只記錄工具調用,而AATF深入記錄選擇原因;通用日誌記錄鍵值事件,而AATF結構化地記錄決策推理。
AATF提供了多種集成方式:通過回調處理器與LangChain集成、通過包裝器與OpenAI集成,以及通用裝飾器。安裝簡單,只有零外部依賴,支持Python 3.10+,代碼庫僅700行純標準庫。
項目狀態:規範v0.1.0已完成,參考SDK有134個通過的測試,支持PII脱敏(電子郵件、電話)和哈希鏈完整性驗證,以及JSON/CSV/HTML導出。未來計劃包括擴展PII脱敏(信用卡、SSN等)、開發TypeScript/JavaScript SDK、建立社區RFC流程以及發佈LangChain/CrewAI官方插件。
該項目適用於代理開發者、合規官、首席信息安全官(CISO)和研究人員。它能夠證明代理的推理質量,調試決策失敗,生成符合歐盟AI法案、GDPR和SOC2要求的機器可解析審計軌跡,並提供數據以供研究代理推理模式和決策樹。
AATF是一個社區驅動的項目,歡迎貢獻者閲讀規範、提出議題、構建集成並傳播理念。它的核心理念是:如果代理能夠思考,那麼它的思考就應該是可審計的。