Lelu:運行時檢測AI代理被操縱的開源授權引擎
Lelu 是一個開源授權引擎,專門用於檢測並防止 AI 代理在運行時被操縱。它通過分層管道(包括提示注入檢測、置信度門控、策略評估和風險模型)來識別異常行為、低置信度決策和提示注入攻擊。Lelu 提供允許、拒絕、人工審核和計算四種結果,並支持自託管。
Lelu 是一款開源的授權引擎,專為 AI 代理設計,能夠在運行時檢測並防止代理被操縱。傳統的授權工具(如 OPA、Casbin 或 AWS AVP)只能阻止未經授權的訪問,但無法識別已授權代理在受到操縱(例如通過提示注入、低置信度決策或異常行為)時執行危險操作。Lelu 填補了這一空白。
Lelu 的核心是一個分層管道,代理的每次操作都會經過多個檢查步驟:首先進行 API 認證和影子代理檢測;然後通過五層提示注入過濾器(精確匹配、同形異義、模糊匹配、結構分析和熵分析);接着是置信度門控,利用 LLM 的 token 對數概率(如 OpenAI 或 Amazon Bedrock)或本地概率/熵來判斷;最後經過策略評估、風險模型和最嚴格結果合併機制。管道輸出四種可能結果:允許(allow)、拒絕(deny)、人工審核(human_review,代理暫停並等待人類批准)或計算(compute,重定向到沙箱執行替代操作)。
Lelu 還提供代理身份管理,通過穩定 UUID 和 RS256 工作負載 JWT(兼容 OIDC)確保代理身份可驗證。它內置 OAuth Token Vault,使用 AES-256-GCM 加密存儲憑據,並支持自動刷新。此外,Lelu 具備非人類身份(NHI)清單管理功能,可掃描註冊代理、影子代理和憑據,檢查 OWASP NHI 十大風險,並生成風險評分。
在部署方面,Lelu 支持自託管,可通過 Docker 或 Helm Chart 快速啓動,默認使用 SQLite(生產環境可切換為 Postgres),並可選用 Redis 進行緩存。項目提供了 TypeScript 和 Python SDK,兼容 OpenAI、Anthropic、LangChain、LangGraph、Vercel AI SDK 和 MCP 等主流框架。Lelu 採用 MIT 許可,歡迎社區貢獻。