2026-06-25 02:39 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-25 03:11 UTC+8

Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控

Lelu 是一個開源授權引擎，用於AI代理的每一次操作，檢測提示注入、低置信度決策，並支援人工稽核。它透過多層管道（包括置信度門控、策略評估和風險模型）確保安全，並提供OAuth令牌保險庫和NHI清單等功能。可自託管，整合主流AI框架。

來源Hacker News AI作者: abeni1990

Lelu 是一個開源的授權引擎，專為AI代理設計，確保每一次操作都經過嚴格的安全檢查。與傳統的授權工具（如OPA、Casbin、AWS AVP）不同，Lelu 能夠檢測到合法授權但被操縱的代理行為，例如透過提示注入或低置信度決策導致的危險操作。

Lelu 的核心是一個多層處理管道：首先進行API認證和影子代理檢測，接著透過五層提示注入過濾器（精確匹配、同形字、模糊匹配、結構分析、熵檢測），然後評估置信度門控（利用OpenAI或Amazon Bedrock的令牌對數機率），再結合基於YAML角色和OPA/Rego的策略評估，最後透過風險模型（關鍵性×(1−置信度)×可靠性×異常因子）得出最終決策。所有決策都會記錄審計日誌，不確定的決策會進入人工稽核佇列，透過Slack、Teams或PagerDuty通知稽核人員。

除了核心授權功能，Lelu 還提供OAuth令牌保險庫，使用AES-256-GCM加密儲存憑證，並支援自動重新整理，內建8個提供商（Google、GitHub、Slack、Salesforce、Notion、Linear、Jira、Microsoft）。NHI清單功能統一管理已註冊代理、影子代理和保險庫憑證，並執行OWASP NHI前十項安全檢查，包括過度許可權、長期金鑰、過時身份和跨租戶重用等。代理身份透過穩定的UUID和RS256工作負載JWT（符合OIDC標準）進行管理，支援MCP OAuth 2.1伺服器和動態註冊。

Lelu 支援快速本地部署，60秒內即可執行演示，無需雲賬戶、Postgres或Redis，僅需SQLite。它提供了Node.js和Python SDK，可與OpenAI、Anthropic、LangChain、LangGraph、CrewAI、Vercel AI SDK和MCP等框架無縫整合。自託管可透過Docker或Helm進行，支援SQLite（本地）和Postgres（生產環境）資料庫。該專案基於MIT許可，歡迎貢獻，程式碼可在GitHub上獲取。