Show HN: 比較兩個AI智能體版本,捕捉靜默權限變化
這款新工具能夠結構性地比較AI智能體的兩個版本,在不依賴LLM的情況下檢測工具權限和信任級別的靜默變化。它完全在瀏覽器中運行,確保隱私,並可以集成到CI/CD流程中。
隨着AI智能體被廣泛使用,其行為常常通過大型語言模型(LLM)進行修改,這可能導致靜默的權限變化——例如,一個原本只能讀取數據的工具突然獲得了退款權限,而開發者可能毫無察覺。針對這一問題,一款名為“Agent Drift”的新工具應運而生,它提供了一種確定性的方法來對比AI智能體的不同版本,確保任何權限或信任級別的變化都能被清晰捕獲。
與傳統依賴LLM進行對比的方式不同,該工具通過結構化解析兩個版本的智能體配置,提取每個版本的工具邊界和信任級別,並應用與AgentAz驗證器相同的保守邏輯。它直接比較工具權限的變化,並以精確的方式指出變化點,例如“issue_refund丟失了審批關卡”,而不是給出模糊的總結。這種確定性方法確保了審計的可重複性和可靠性。
此外,該工具完全在瀏覽器中運行,用户粘貼的內容不會被上傳或存儲,從而保障了數據隱私。對於需要持續監控的場景,開發者可以將智能體接入Agent Watch服務以追蹤漂移,或在CI流水線中通過GitHub Action強制執行最大權限等級。這使得權限管理從手動檢查轉向自動化、持續化的控制,特別適合快速迭代的AI開發環境。