2026-06-25 02:39 UTC+8站内改写1 分钟阅读更新: 2026-06-25 03:11 UTC+8

Show HN: Lelu – 基于置信度和提示注入的OpenAI代理门控

Lelu 是一个开源授权引擎，用于AI代理的每一次操作，检测提示注入、低置信度决策，并支持人工审核。它通过多层管道（包括置信度门控、策略评估和风险模型）确保安全，并提供OAuth令牌保险库和NHI清单等功能。可自托管，集成主流AI框架。

来源Hacker News AI作者: abeni1990

Lelu 是一个开源的授权引擎，专为AI代理设计，确保每一次操作都经过严格的安全检查。与传统的授权工具（如OPA、Casbin、AWS AVP）不同，Lelu 能够检测到合法授权但被操纵的代理行为，例如通过提示注入或低置信度决策导致的危险操作。

Lelu 的核心是一个多层处理管道：首先进行API认证和影子代理检测，接着通过五层提示注入过滤器（精确匹配、同形字、模糊匹配、结构分析、熵检测），然后评估置信度门控（利用OpenAI或Amazon Bedrock的令牌对数概率），再结合基于YAML角色和OPA/Rego的策略评估，最后通过风险模型（关键性×(1−置信度)×可靠性×异常因子）得出最终决策。所有决策都会记录审计日志，不确定的决策会进入人工审核队列，通过Slack、Teams或PagerDuty通知审核人员。

除了核心授权功能，Lelu 还提供OAuth令牌保险库，使用AES-256-GCM加密存储凭证，并支持自动刷新，内置8个提供商（Google、GitHub、Slack、Salesforce、Notion、Linear、Jira、Microsoft）。NHI清单功能统一管理已注册代理、影子代理和保险库凭证，并执行OWASP NHI前十项安全检查，包括过度权限、长期密钥、过时身份和跨租户重用等。代理身份通过稳定的UUID和RS256工作负载JWT（符合OIDC标准）进行管理，支持MCP OAuth 2.1服务器和动态注册。

Lelu 支持快速本地部署，60秒内即可运行演示，无需云账户、Postgres或Redis，仅需SQLite。它提供了Node.js和Python SDK，可与OpenAI、Anthropic、LangChain、LangGraph、CrewAI、Vercel AI SDK和MCP等框架无缝集成。自托管可通过Docker或Helm进行，支持SQLite（本地）和Postgres（生产环境）数据库。该项目基于MIT许可，欢迎贡献，代码可在GitHub上获取。