AI News HubLIVE
站内改写2 分鐘閱讀

AATF – 記錄AI代理決策原因的開放規範

AATF是一個開放規範及參考SDK,用於記錄AI代理的每一步決策,包括考慮的替代方案、置信度以及被拒絕的選擇。它旨在提供決策可審計性,類似於OpenTelemetry的可觀測性,但專注於代理決策的透明度和可問責性。本文介紹了AATF的核心格式、快速上手示例、與其他工具的對比、整合方式以及專案狀態。

來源Hacker News AI作者: wdh107

AATF(Agent Audit Trail Format)是一個開放規範及其參考SDK,旨在解決AI代理決策透明度的關鍵問題。與傳統的日誌記錄工具不同,AATF專注於記錄代理為什麼做出某個決策,而不是僅僅記錄它做了什麼。它由GitHub倉庫agent-audit-trail提供,採用MIT許可證,目前處於v0.1.0草案階段。

AATF的核心是Decision記錄,它包含以下欄位:型別(如reasoning)、名稱、決策物件(包括輸入摘要、決策內容、推理、置信度及其依據)以及考慮的替代方案(包括描述、拒絕原因和分數)。此外,每個步驟帶有SHA-256雜湊鏈以確保防篡改,並內建了PII脫敏功能。

快速入門只需幾行Python程式碼:建立AuditSession,然後新增推理步驟,其中包含決策和替代方案。例如,當使用者請求天氣資訊時,代理可以選擇使用天氣API並從記憶回答或請求澄清中決定,系統會記錄每個選擇的理由和置信度。

AATF強調三個其他格式無法捕獲的特性:1)alternatives_considered——強制列出代理未選擇的內容,證明其推理並非事後合理化;2)confidence + confidence_basis——數值置信度及其確定依據,允許審計人員區分基於事實的“95%確信”和主觀的“95%確信”;3)confidence_trajectory——跟蹤整個決策鏈中的置信度變化,揭示代理在資訊收集過程中確定性的增減。

與現有工具的比較:區塊鏈賬本關注儲存的不可篡改性,但AATF格式無關;LangChain回撥是框架特定的追蹤,而AATF框架無關,可與CrewAI、AutoGen等協同工作;MCP審計工具只記錄工具呼叫,而AATF深入記錄選擇原因;通用日誌記錄鍵值事件,而AATF結構化地記錄決策推理。

AATF提供了多種整合方式:透過回撥處理器與LangChain整合、透過包裝器與OpenAI整合,以及通用裝飾器。安裝簡單,只有零外部依賴,支援Python 3.10+,程式碼庫僅700行純標準庫。

專案狀態:規範v0.1.0已完成,參考SDK有134個透過的測試,支援PII脫敏(電子郵件、電話)和雜湊鏈完整性驗證,以及JSON/CSV/HTML匯出。未來計劃包括擴充套件PII脫敏(信用卡、SSN等)、開發TypeScript/JavaScript SDK、建立社群RFC流程以及釋出LangChain/CrewAI官方外掛。

該專案適用於代理開發者、合規官、首席資訊安全官(CISO)和研究人員。它能夠證明代理的推理質量,除錯決策失敗,生成符合歐盟AI法案、GDPR和SOC2要求的機器可解析審計軌跡,並提供資料以供研究代理推理模式和決策樹。

AATF是一個社群驅動的專案,歡迎貢獻者閱讀規範、提出議題、構建整合並傳播理念。它的核心理念是:如果代理能夠思考,那麼它的思考就應該是可審計的。