Show HN: 比較兩個AI智慧體版本,捕捉靜默許可權變化
這款新工具能夠結構性地比較AI智慧體的兩個版本,在不依賴LLM的情況下檢測工具許可權和信任級別的靜默變化。它完全在瀏覽器中執行,確保隱私,並可以整合到CI/CD流程中。
隨著AI智慧體被廣泛使用,其行為常常透過大型語言模型(LLM)進行修改,這可能導致靜默的許可權變化——例如,一個原本只能讀取資料的工具突然獲得了退款許可權,而開發者可能毫無察覺。針對這一問題,一款名為“Agent Drift”的新工具應運而生,它提供了一種確定性的方法來對比AI智慧體的不同版本,確保任何許可權或信任級別的變化都能被清晰捕獲。
與傳統依賴LLM進行對比的方式不同,該工具透過結構化解析兩個版本的智慧體配置,提取每個版本的工具邊界和信任級別,並應用與AgentAz驗證器相同的保守邏輯。它直接比較工具許可權的變化,並以精確的方式指出變化點,例如“issue_refund丟失了審批關卡”,而不是給出模糊的總結。這種確定性方法確保了審計的可重複性和可靠性。
此外,該工具完全在瀏覽器中執行,使用者貼上的內容不會被上傳或儲存,從而保障了資料隱私。對於需要持續監控的場景,開發者可以將智慧體接入Agent Watch服務以追蹤漂移,或在CI流水線中透過GitHub Action強制執行最大許可權等級。這使得許可權管理從手動檢查轉向自動化、持續化的控制,特別適合快速迭代的AI開發環境。