Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控
Lelu 是一個開源授權引擎,用於AI代理的每一次操作,檢測提示注入、低置信度決策,並支援人工稽核。它透過多層管道(包括置信度門控、策略評估和風險模型)確保安全,並提供OAuth令牌保險庫和NHI清單等功能。可自託管,整合主流AI框架。
Lelu 是一個開源的授權引擎,專為AI代理設計,確保每一次操作都經過嚴格的安全檢查。與傳統的授權工具(如OPA、Casbin、AWS AVP)不同,Lelu 能夠檢測到合法授權但被操縱的代理行為,例如透過提示注入或低置信度決策導致的危險操作。
Lelu 的核心是一個多層處理管道:首先進行API認證和影子代理檢測,接著透過五層提示注入過濾器(精確匹配、同形字、模糊匹配、結構分析、熵檢測),然後評估置信度門控(利用OpenAI或Amazon Bedrock的令牌對數機率),再結合基於YAML角色和OPA/Rego的策略評估,最後透過風險模型(關鍵性×(1−置信度)×可靠性×異常因子)得出最終決策。所有決策都會記錄審計日誌,不確定的決策會進入人工稽核佇列,透過Slack、Teams或PagerDuty通知稽核人員。
除了核心授權功能,Lelu 還提供OAuth令牌保險庫,使用AES-256-GCM加密儲存憑證,並支援自動重新整理,內建8個提供商(Google、GitHub、Slack、Salesforce、Notion、Linear、Jira、Microsoft)。NHI清單功能統一管理已註冊代理、影子代理和保險庫憑證,並執行OWASP NHI前十項安全檢查,包括過度許可權、長期金鑰、過時身份和跨租戶重用等。代理身份透過穩定的UUID和RS256工作負載JWT(符合OIDC標準)進行管理,支援MCP OAuth 2.1伺服器和動態註冊。
Lelu 支援快速本地部署,60秒內即可執行演示,無需雲賬戶、Postgres或Redis,僅需SQLite。它提供了Node.js和Python SDK,可與OpenAI、Anthropic、LangChain、LangGraph、CrewAI、Vercel AI SDK和MCP等框架無縫整合。自託管可透過Docker或Helm進行,支援SQLite(本地)和Postgres(生產環境)資料庫。該專案基於MIT許可,歡迎貢獻,程式碼可在GitHub上獲取。