AI News HubLIVE
站內改寫1 分鐘閱讀

Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控

Lelu 是一個開源授權引擎,用於AI代理的每一次操作,檢測提示注入、低置信度決策,並支持人工審核。它通過多層管道(包括置信度門控、策略評估和風險模型)確保安全,並提供OAuth令牌保險庫和NHI清單等功能。可自託管,集成主流AI框架。

來源Hacker News AI作者: abeni1990

Lelu 是一個開源的授權引擎,專為AI代理設計,確保每一次操作都經過嚴格的安全檢查。與傳統的授權工具(如OPA、Casbin、AWS AVP)不同,Lelu 能夠檢測到合法授權但被操縱的代理行為,例如通過提示注入或低置信度決策導致的危險操作。

Lelu 的核心是一個多層處理管道:首先進行API認證和影子代理檢測,接着通過五層提示注入過濾器(精確匹配、同形字、模糊匹配、結構分析、熵檢測),然後評估置信度門控(利用OpenAI或Amazon Bedrock的令牌對數概率),再結合基於YAML角色和OPA/Rego的策略評估,最後通過風險模型(關鍵性×(1−置信度)×可靠性×異常因子)得出最終決策。所有決策都會記錄審計日誌,不確定的決策會進入人工審核隊列,通過Slack、Teams或PagerDuty通知審核人員。

除了核心授權功能,Lelu 還提供OAuth令牌保險庫,使用AES-256-GCM加密存儲憑證,並支持自動刷新,內置8個提供商(Google、GitHub、Slack、Salesforce、Notion、Linear、Jira、Microsoft)。NHI清單功能統一管理已註冊代理、影子代理和保險庫憑證,並執行OWASP NHI前十項安全檢查,包括過度權限、長期密鑰、過時身份和跨租户重用等。代理身份通過穩定的UUID和RS256工作負載JWT(符合OIDC標準)進行管理,支持MCP OAuth 2.1服務器和動態註冊。

Lelu 支持快速本地部署,60秒內即可運行演示,無需雲賬户、Postgres或Redis,僅需SQLite。它提供了Node.js和Python SDK,可與OpenAI、Anthropic、LangChain、LangGraph、CrewAI、Vercel AI SDK和MCP等框架無縫集成。自託管可通過Docker或Helm進行,支持SQLite(本地)和Postgres(生產環境)數據庫。該項目基於MIT許可,歡迎貢獻,代碼可在GitHub上獲取。