AI News HubLIVE
站内改写2 分钟阅读

AATF – 记录AI代理决策原因的开放规范

AATF是一个开放规范及参考SDK,用于记录AI代理的每一步决策,包括考虑的替代方案、置信度以及被拒绝的选择。它旨在提供决策可审计性,类似于OpenTelemetry的可观测性,但专注于代理决策的透明度和可问责性。本文介绍了AATF的核心格式、快速上手示例、与其他工具的对比、集成方式以及项目状态。

来源Hacker News AI作者: wdh107

AATF(Agent Audit Trail Format)是一个开放规范及其参考SDK,旨在解决AI代理决策透明度的关键问题。与传统的日志记录工具不同,AATF专注于记录代理为什么做出某个决策,而不是仅仅记录它做了什么。它由GitHub仓库agent-audit-trail提供,采用MIT许可证,目前处于v0.1.0草案阶段。

AATF的核心是Decision记录,它包含以下字段:类型(如reasoning)、名称、决策对象(包括输入摘要、决策内容、推理、置信度及其依据)以及考虑的替代方案(包括描述、拒绝原因和分数)。此外,每个步骤带有SHA-256哈希链以确保防篡改,并内置了PII脱敏功能。

快速入门只需几行Python代码:创建AuditSession,然后添加推理步骤,其中包含决策和替代方案。例如,当用户请求天气信息时,代理可以选择使用天气API并从记忆回答或请求澄清中决定,系统会记录每个选择的理由和置信度。

AATF强调三个其他格式无法捕获的特性:1)alternatives_considered——强制列出代理未选择的内容,证明其推理并非事后合理化;2)confidence + confidence_basis——数值置信度及其确定依据,允许审计人员区分基于事实的“95%确信”和主观的“95%确信”;3)confidence_trajectory——跟踪整个决策链中的置信度变化,揭示代理在信息收集过程中确定性的增减。

与现有工具的比较:区块链账本关注存储的不可篡改性,但AATF格式无关;LangChain回调是框架特定的追踪,而AATF框架无关,可与CrewAI、AutoGen等协同工作;MCP审计工具只记录工具调用,而AATF深入记录选择原因;通用日志记录键值事件,而AATF结构化地记录决策推理。

AATF提供了多种集成方式:通过回调处理器与LangChain集成、通过包装器与OpenAI集成,以及通用装饰器。安装简单,只有零外部依赖,支持Python 3.10+,代码库仅700行纯标准库。

项目状态:规范v0.1.0已完成,参考SDK有134个通过的测试,支持PII脱敏(电子邮件、电话)和哈希链完整性验证,以及JSON/CSV/HTML导出。未来计划包括扩展PII脱敏(信用卡、SSN等)、开发TypeScript/JavaScript SDK、建立社区RFC流程以及发布LangChain/CrewAI官方插件。

该项目适用于代理开发者、合规官、首席信息安全官(CISO)和研究人员。它能够证明代理的推理质量,调试决策失败,生成符合欧盟AI法案、GDPR和SOC2要求的机器可解析审计轨迹,并提供数据以供研究代理推理模式和决策树。

AATF是一个社区驱动的项目,欢迎贡献者阅读规范、提出议题、构建集成并传播理念。它的核心理念是:如果代理能够思考,那么它的思考就应该是可审计的。