OpenAI 开放安全模型首发支持
GroqCloud 宣布即日起支持 OpenAI 最新开源安全模型 GPT-OSS-Safeguard-20B,提供超过 1000 t/s 的推理速度。该模型专为安全分类工作负载设计,支持用户自定义策略、可配置推理力度及完整推理轨迹,适用于企业文档扫描、AI 聊天机器人、政策审计和用户生成内容平台等场景。定价与基础 GPT-OSS-20B 相同,输入 token $0.075/M,输出 token $0.30/M。
GroqCloud 今日宣布正式支持 OpenAI 最新开源安全模型 GPT-OSS-Safeguard-20B,用户可即时按需访问,推理速度超过 1000 tokens/秒。这是 OpenAI 首个专为安全分类设计的开源推理模型,支持用户自定义策略,并能在数分钟内投入生产。
GPT-OSS-Safeguard-20B 基于 OpenAI 的 GPT-OSS-20B 微调而来,专用于安全场景。它采用安全优先推理方式,能够遵循用户提供的明确策略并解释其决策过程。简而言之,该模型提供基于推理的分类结果而非原始分数,大大简化了调试与合规工作。
在 GroqCloud 上,信任与安全团队可获得以下核心功能:自带策略(BYOP)——加载任何分类体系、定义集或阈值,模型将据此推理;可配置推理力度(低/中/高)——在单次请求中平衡延迟与分析深度;完整推理轨迹——返回思维链,便于审计与调试;提示缓存——相同策略提示可在数百万次调用中重用,显著降低延迟与成本,缓存 token 折扣高达 50%;以及 128k token 上下文窗口,支持长文档或多轮对话处理。
在性价比方面,Groq 的专用堆栈为 OpenAI 的新安全模型优化了每 token 成本,同时保持速度与准确率。GPT-OSS-Safeguard-20B 在 GroqCloud 上的速度达 1000+ t/s,定价与基础 GPT-OSS-20B 相同:输入 token $0.075/M,输出 token $0.30/M。
该模型适用于多种真实场景:企业文档扫描——定义机密数据(PII、PHI、财务信息)策略,自动检测违规并解释原因;AI 聊天机器人——将安全策略嵌入系统提示,拦截或重写不安全输入;自动化政策审计——将现有规则作为“政策中的政策”输入,要求模型建议漏洞或改进;用户生成内容平台——对每个新帖子或评论运行模型,捕捉欺诈、违禁物品或误导性语言。
开发者可通过 GroqCloud Developer Console、Playground 和 API 立即试用 openai/gpt-oss-safeguard-20b。更多内容审核最佳实践,请参阅Groq开发者文档。