护栏:保护您的代理、数据和成本 | OpenRouter
OpenRouter 推出了工作区护栏功能,这是一套可配置的安全与治理工具,包括预算执行、零数据保留、模型和提供商限制、提示注入防御以及数据丢失预防。护栏可以分配给 API 密钥或团队成员,无需更改代码即可实现精细化管理。
文章情报
要点
- 预算执行:支持每日、每周或每月的支出限制,每个实体独立计算。
- 零数据保留与模型/提供商限制:一键禁用数据保留端点,或限制为允许列表中的模型/提供商。
- 提示注入防御:基于 30 多个正则表达式模式检测注入攻击,支持标记、编辑或阻止请求。
- 数据丢失预防:内置七种敏感信息类型和自定义正则表达式,可编辑或阻止包含 PII 的请求。
为什么重要
这条新闻值得关注,因为预算执行:支持每日、每周或每月的支出限制,每个实体独立计算。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
OpenRouter 近日为其工作区推出了全新的“护栏”功能,这是一套可配置的安全与治理工具,旨在帮助用户保护代理、数据和成本。护栏包括预算执行、零数据保留(ZDR)、模型和提供商限制、提示注入防御以及数据丢失预防(DLP)等多个模块。用户可以在不修改代码的情况下,将这些规则层层叠加,应用于整个工作区,或者为特定的团队成员组或 API 密钥创建自定义护栏。
要开始使用,用户可以在主仪表盘中进入“工作区 > 护栏”页面,或者通过管理 API 进行配置。每个工作区都有一个默认的护栏,可以作为基线应用于所有 API 密钥和成员。此外,用户还可以创建额外的护栏,对特定的密钥或成员实施更严格的限制。
预算执行功能允许用户设置每日、每周或每月的支出限额。当请求超过限额时,将返回 403 错误响应。每个实体(如成员或 API 密钥)的预算是独立的,不会共享。例如,为三个团队成员各分配一个每日 50 美元限额的护栏,每个人都有自己的 50 美元预算。API 密钥的预算在成员预算之上独立叠加,两者在每次请求时都会同时检查。
零数据保留和模型/提供商限制功能让用户能够一键禁用所有保留或训练数据的端点,阻止单个模型或提供商,或者将工作区限制在允许列表内的模型和提供商。不允许的请求将返回 403 错误。用户账户级别的隐私策略和提供商限制默认被继承,而护栏只能施加更严格的限制。
提示注入防御功能通过一组超过 30 个正则表达式模式(源自 OWASP LLM 提示注入预防速查表及其他资源)来识别提示注入和越狱尝试。检测系统包括捕捉常见规避策略的技术,如字形变异、编码和字符间距规避。检测是确定性的,延迟开销极小。检测在请求发送到模型提供商之前进行,因此被阻止的流量永远不会离开 OpenRouter。用户可以选择三种处理方式:标记(允许请求通过,仅记录检测结果)、编辑(将匹配部分替换为 [PROMPT_INJECTION] 后发送)和阻止(整个请求被拒绝并返回 403,包含检测到的模式类型元数据)。
数据丢失预防功能用于检测和处理请求中的 PII 及其他敏感信息。内置七种敏感信息类型,包括电子邮件地址、电话号码、社会安全号码、信用卡号码、IP 地址、人名和地址。用户还可以添加自定义正则表达式模式,用于特定领域的敏感数据,如内部项目代号或专有 IP。每个模式可以配置为编辑或阻止请求。内置的大部分模式和所有自定义模式使用正则表达式匹配,这是确定性的且延迟极小。人名和地址使用自然语言处理(通过 Presidio),延迟与输入大小成正比。
护栏可以分配给多个 API 密钥或成员。当分配给成员时,护栏将应用于该成员在工作区中的所有密钥。每个工作区都有一个可配置的默认护栏,适用于所有 API 密钥和成员。其他护栏在此基础上叠加。用户也可以通过管理 API 以编程方式配置护栏,包括创建、更新、删除、列出以及分配给密钥或成员,从而在团队入职或密钥轮换时实现自动化配置。
有关更多详细信息,用户可以查阅护栏文档概述和 API 参考。