2026-06-01 04:07 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

微軟Agent治理工具包實現：通過策略、審批、審計日誌和風險控制實現安全的AI代理工具使用

本教程基於微軟的Agent治理工具包，構建了一個受治理的AI代理工作流。實現中，代理不會直接執行工具，而是每個操作首先通過治理層，檢查代理身份、信任分數、風險等級、請求工具、操作類型、敏感級別和策略規則。定義了基於YAML的策略，用於控制破壞性數據庫操作、外部郵件發送、shell執行、敏感數據訪問和金融轉賬。每個工具都包裝了治理邏輯，操作可以被允許、拒絕、沙盒化或通過審批步驟後再執行。還生成了防篡改的審計記錄、運行策略測試、激活緊急停止開關、彙總治理決策，並將代理、工具、規則和結果之間的關係可視化為圖。

來源MarkTechPost作者: Sana Hassan

本教程詳細介紹瞭如何基於微軟的Agent治理工具包構建一個受嚴格治理的AI代理工作流。我們創建了一個可在Google Colab中直接運行的實現，其核心思想是：代理不會直接調用任何工具，而是每個操作必須首先通過一個治理層。該治理層會逐一檢查代理的身份標識、信任分數、風險等級、所請求的工具名稱、操作類型、敏感級別以及當前生效的策略規則。

我們首先搭建了Colab環境，安裝了所需的Python庫（如pyyaml、pandas、networkx、matplotlib、rich等），並克隆了微軟Agent治理工具包的官方倉庫。隨後，我們定義了一個基於YAML格式的治理策略文件（advanced_agent_policy.yaml），該策略包含多個關鍵規則：禁止代理執行破壞性數據庫操作（如drop_table、delete_table、truncate_table）；要求對外部郵件發送進行人工審批；將shell命令放入沙盒環境執行，並阻止危險命令（如rm -rf、curl http、wget http、chmod 777、sudo）；限制低信任代理訪問敏感數據；要求對大額金融轉賬進行審批；以及對高風險代理的自主操作進行速率限制。策略的默認行為是允許，但一旦觸發規則則執行相應動作。

接下來，我們實現了核心的數據結構：AgentIdentity（代理身份）包含代理ID、名稱、角色、所有者、信任分數、風險等級和作用域；GovernanceDecision（治理決策）記錄每次決策的詳細信息；同時定義了GovernanceDenied、ApprovalRequired、SandboxViolation等異常類。我們還創建了一個DotDict輔助類，使得策略條件可以通過點操作符輕鬆訪問action.type和identity.trust_score等字段。基於這些，我們構建了安全的條件評估器safe_eval_condition，它在一個嚴格受限的命名空間內執行策略條件表達式，確保安全性。

審計日誌是治理體系的關鍵組成部分。我們實現了TamperEvidentAuditLog類，它採用鏈式哈希機制：每個新記錄都包含前一條記錄的哈希值，從而形成一條防篡改的證據鏈。審計日誌支持追加記錄、驗證完整性以及將記錄轉換為Pandas DataFrame以便分析。每條記錄包含決策ID、時間戳、策略名稱、代理ID、工具名稱、動作詳情、決策結果、匹配規則、嚴重級別、原因以及批准人等信息。

治理引擎TutorialGovernanceEngine是系統的核心。它加載YAML策略並持有審計日誌實例。引擎提供了evaluate方法，對於給定代理和動作，依次檢查每個規則的條件。如果匹配，則根據規則的動作類型（deny、require_approval、sandbox）返回相應的決策。引擎還包含一個全局緊急停止開關（kill_switch），一旦激活，所有後續操作將直接被拒絕。此外，引擎維護了一個錯誤預算和最近拒絕次數計數器，用於監控和限制。

我們還為示例工具（數據庫查詢、郵件發送、shell執行）編寫了模擬實現。每個工具都通過治理引擎的evaluate方法進行包裝。例如，在shell_exec函數中，我們只允許echo、date、pwd、ls等安全命令，其他命令被阻止。在完整的實現中，實際工具調用會遵循治理決策的結果。

最後，我們運行了一系列策略測試，模擬了不同代理身份和操作場景，驗證了策略的正確性。我們還生成了審計日誌的DataFrame摘要，並使用NetworkX和Matplotlib繪製了代理、工具、規則和決策結果之間的關係圖。這個圖可以幫助組織快速理解治理體系的運行情況。

整個實現提供了一套完整的框架，使得AI代理的行為可以受到細粒度的安全控制，確保其符合組織的安全和合規要求。YAML策略的靈活性使得規則可以輕鬆擴展以適應更多場景，而審計日誌和可視化功能則增強了透明度和可追溯性。