2026-06-25 02:39 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-25 03:11 UTC+8

Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控

Lelu 是一個開源授權引擎，用於AI代理的每一次操作，檢測提示注入、低置信度決策，並支持人工審核。它通過多層管道（包括置信度門控、策略評估和風險模型）確保安全，並提供OAuth令牌保險庫和NHI清單等功能。可自託管，集成主流AI框架。

來源Hacker News AI作者: abeni1990

Lelu 是一個開源的授權引擎，專為AI代理設計，確保每一次操作都經過嚴格的安全檢查。與傳統的授權工具（如OPA、Casbin、AWS AVP）不同，Lelu 能夠檢測到合法授權但被操縱的代理行為，例如通過提示注入或低置信度決策導致的危險操作。

Lelu 的核心是一個多層處理管道：首先進行API認證和影子代理檢測，接着通過五層提示注入過濾器（精確匹配、同形字、模糊匹配、結構分析、熵檢測），然後評估置信度門控（利用OpenAI或Amazon Bedrock的令牌對數概率），再結合基於YAML角色和OPA/Rego的策略評估，最後通過風險模型（關鍵性×(1−置信度)×可靠性×異常因子）得出最終決策。所有決策都會記錄審計日誌，不確定的決策會進入人工審核隊列，通過Slack、Teams或PagerDuty通知審核人員。

除了核心授權功能，Lelu 還提供OAuth令牌保險庫，使用AES-256-GCM加密存儲憑證，並支持自動刷新，內置8個提供商（Google、GitHub、Slack、Salesforce、Notion、Linear、Jira、Microsoft）。NHI清單功能統一管理已註冊代理、影子代理和保險庫憑證，並執行OWASP NHI前十項安全檢查，包括過度權限、長期密鑰、過時身份和跨租户重用等。代理身份通過穩定的UUID和RS256工作負載JWT（符合OIDC標準）進行管理，支持MCP OAuth 2.1服務器和動態註冊。

Lelu 支持快速本地部署，60秒內即可運行演示，無需雲賬户、Postgres或Redis，僅需SQLite。它提供了Node.js和Python SDK，可與OpenAI、Anthropic、LangChain、LangGraph、CrewAI、Vercel AI SDK和MCP等框架無縫集成。自託管可通過Docker或Helm進行，支持SQLite（本地）和Postgres（生產環境）數據庫。該項目基於MIT許可，歡迎貢獻，代碼可在GitHub上獲取。