Show HN: 比较两个AI智能体版本,捕捉静默权限变化
这款新工具能够结构性地比较AI智能体的两个版本,在不依赖LLM的情况下检测工具权限和信任级别的静默变化。它完全在浏览器中运行,确保隐私,并可以集成到CI/CD流程中。
随着AI智能体被广泛使用,其行为常常通过大型语言模型(LLM)进行修改,这可能导致静默的权限变化——例如,一个原本只能读取数据的工具突然获得了退款权限,而开发者可能毫无察觉。针对这一问题,一款名为“Agent Drift”的新工具应运而生,它提供了一种确定性的方法来对比AI智能体的不同版本,确保任何权限或信任级别的变化都能被清晰捕获。
与传统依赖LLM进行对比的方式不同,该工具通过结构化解析两个版本的智能体配置,提取每个版本的工具边界和信任级别,并应用与AgentAz验证器相同的保守逻辑。它直接比较工具权限的变化,并以精确的方式指出变化点,例如“issue_refund丢失了审批关卡”,而不是给出模糊的总结。这种确定性方法确保了审计的可重复性和可靠性。
此外,该工具完全在浏览器中运行,用户粘贴的内容不会被上传或存储,从而保障了数据隐私。对于需要持续监控的场景,开发者可以将智能体接入Agent Watch服务以追踪漂移,或在CI流水线中通过GitHub Action强制执行最大权限等级。这使得权限管理从手动检查转向自动化、持续化的控制,特别适合快速迭代的AI开发环境。