AI News HubLIVE
站内改写1 分钟阅读

Show HN: Lelu – 基于置信度和提示注入的OpenAI代理门控

Lelu 是一个开源授权引擎,用于AI代理的每一次操作,检测提示注入、低置信度决策,并支持人工审核。它通过多层管道(包括置信度门控、策略评估和风险模型)确保安全,并提供OAuth令牌保险库和NHI清单等功能。可自托管,集成主流AI框架。

来源Hacker News AI作者: abeni1990

Lelu 是一个开源的授权引擎,专为AI代理设计,确保每一次操作都经过严格的安全检查。与传统的授权工具(如OPA、Casbin、AWS AVP)不同,Lelu 能够检测到合法授权但被操纵的代理行为,例如通过提示注入或低置信度决策导致的危险操作。

Lelu 的核心是一个多层处理管道:首先进行API认证和影子代理检测,接着通过五层提示注入过滤器(精确匹配、同形字、模糊匹配、结构分析、熵检测),然后评估置信度门控(利用OpenAI或Amazon Bedrock的令牌对数概率),再结合基于YAML角色和OPA/Rego的策略评估,最后通过风险模型(关键性×(1−置信度)×可靠性×异常因子)得出最终决策。所有决策都会记录审计日志,不确定的决策会进入人工审核队列,通过Slack、Teams或PagerDuty通知审核人员。

除了核心授权功能,Lelu 还提供OAuth令牌保险库,使用AES-256-GCM加密存储凭证,并支持自动刷新,内置8个提供商(Google、GitHub、Slack、Salesforce、Notion、Linear、Jira、Microsoft)。NHI清单功能统一管理已注册代理、影子代理和保险库凭证,并执行OWASP NHI前十项安全检查,包括过度权限、长期密钥、过时身份和跨租户重用等。代理身份通过稳定的UUID和RS256工作负载JWT(符合OIDC标准)进行管理,支持MCP OAuth 2.1服务器和动态注册。

Lelu 支持快速本地部署,60秒内即可运行演示,无需云账户、Postgres或Redis,仅需SQLite。它提供了Node.js和Python SDK,可与OpenAI、Anthropic、LangChain、LangGraph、CrewAI、Vercel AI SDK和MCP等框架无缝集成。自托管可通过Docker或Helm进行,支持SQLite(本地)和Postgres(生产环境)数据库。该项目基于MIT许可,欢迎贡献,代码可在GitHub上获取。

Show HN: Lelu – 基于置信度和提示注入的OpenAI代理门控 | AI News Hub