ContextWall – AI代理和RAG管道的上下文防火牆
ContextWall是一個開源上下文防火牆,可在內容進入AI模型的上下文視窗前攔截並掃描,防止提示注入、憑證洩露和PII洩露。它無需更改代理程式碼,執行在使用者的基礎設施內,並提供三層檢測機制和源信任分級。
ContextWall 是一款專為 AI 代理和 RAG 管道設計的上下文防火牆,旨在解決 LLM 無法區分可信與不可信內容的根本問題。該工具以 Apache 2.0 開源許可釋出,並提供免費早期訪問。
在典型的 AI 架構中,代理從網頁、文件或 API 檢索的內容會直接進入模型的上下文視窗,未經任何審查。攻擊者利用這一漏洞,透過精心構造的電子郵件或文件實施提示注入、RAG 投毒、憑證洩露和 PII 竊取。例如,CVE-2025-32711(EchoLeak)中,攻擊者向 Microsoft 365 Copilot 傳送一封惡意郵件,Copilot 將其中的嵌入指令解釋為命令,無需使用者點選即可訪問內部 SharePoint 檔案併傳送給攻擊者。另外,USENIX Security 2025 上展示的 PoisonedRAG 攻擊,只需在數百萬文件的知識庫中植入五個對抗性文件,即可在 90% 以上的查詢中操縱模型輸出。
ContextWall 透過在內容進入上下文視窗前攔截並掃描,為 AI 應用提供信任邊界。其工作原理如下:當代理請求文件時,守護程序在 LLM 看到內容前接收文件,依次執行三個檢測層:L1 結構掃描(檢查雙向控制字元、零寬字元等)、L2 模式匹配(正規表示式檢測注入語法、API 金鑰、PII)、L3 啟發式評分(評估語義意圖,捕捉同義改寫)。根據源信任層級(內部、外部、不可信、受監管)和策略規則,決定阻止或放行。
該工具專為將 AI 投入生產的團隊設計,包括 AI 和代理工程師、安全團隊以及合規和法律團隊。它無需修改代理程式碼,透過 pip 安裝或 Docker 映象即可部署,支援本地策略配置 YAML 檔案,幷包含 HIPAA、SOC 2 和 FedRAMP 的合規模板。資料流方面,所有篩查都在使用者基礎設施內本地進行,控制平面僅接收請求計數、違規型別和延遲等後設資料,從不接觸提示內容或使用者資料。
ContextWall 明確其能力範圍:可檢測並阻止直接指令覆蓋、雙向/零寬字元混淆、間隔字母注入、語義同義改寫注入、憑證洩露和 PII 竊取;但不包括模型幻覺、系統提示錯誤、訓練時投毒或未知零日模式。它的設計強調防禦縱深,與模型提供商的安全過濾器協同工作。此外,ContextWall 支援離線部署,可在完全氣隙環境中執行,無需外部依賴。