2026-06-22 03:35 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-22 07:31 UTC+8

Lelu：運行時檢測AI代理被操縱的開源授權引擎

Lelu 是一個開源授權引擎，專門用於檢測並防止 AI 代理在運行時被操縱。它通過分層管道（包括提示注入檢測、置信度門控、策略評估和風險模型）來識別異常行為、低置信度決策和提示注入攻擊。Lelu 提供允許、拒絕、人工審核和計算四種結果，並支持自託管。

來源Hacker News AI作者: Abenezer0923

Lelu 是一款開源的授權引擎，專為 AI 代理設計，能夠在運行時檢測並防止代理被操縱。傳統的授權工具（如 OPA、Casbin 或 AWS AVP）只能阻止未經授權的訪問，但無法識別已授權代理在受到操縱（例如通過提示注入、低置信度決策或異常行為）時執行危險操作。Lelu 填補了這一空白。

Lelu 的核心是一個分層管道，代理的每次操作都會經過多個檢查步驟：首先進行 API 認證和影子代理檢測；然後通過五層提示注入過濾器（精確匹配、同形異義、模糊匹配、結構分析和熵分析）；接着是置信度門控，利用 LLM 的 token 對數概率（如 OpenAI 或 Amazon Bedrock）或本地概率/熵來判斷；最後經過策略評估、風險模型和最嚴格結果合併機制。管道輸出四種可能結果：允許（allow）、拒絕（deny）、人工審核（human_review，代理暫停並等待人類批准）或計算（compute，重定向到沙箱執行替代操作）。

Lelu 還提供代理身份管理，通過穩定 UUID 和 RS256 工作負載 JWT（兼容 OIDC）確保代理身份可驗證。它內置 OAuth Token Vault，使用 AES-256-GCM 加密存儲憑據，並支持自動刷新。此外，Lelu 具備非人類身份（NHI）清單管理功能，可掃描註冊代理、影子代理和憑據，檢查 OWASP NHI 十大風險，並生成風險評分。

在部署方面，Lelu 支持自託管，可通過 Docker 或 Helm Chart 快速啓動，默認使用 SQLite（生產環境可切換為 Postgres），並可選用 Redis 進行緩存。項目提供了 TypeScript 和 Python SDK，兼容 OpenAI、Anthropic、LangChain、LangGraph、Vercel AI SDK 和 MCP 等主流框架。Lelu 採用 MIT 許可，歡迎社區貢獻。