2026-05-15 10:15 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

OpenAI 开放安全模型首发支持

GroqCloud 宣布即日起支持 OpenAI 最新开源安全模型 GPT-OSS-Safeguard-20B，提供超过 1000 t/s 的推理速度。该模型专为安全分类工作负载设计，支持用户自定义策略、可配置推理力度及完整推理轨迹，适用于企业文档扫描、AI 聊天机器人、政策审计和用户生成内容平台等场景。定价与基础 GPT-OSS-20B 相同，输入 token $0.075/M，输出 token $0.30/M。

来源Groq Blog

GroqCloud 今日宣布正式支持 OpenAI 最新开源安全模型 GPT-OSS-Safeguard-20B，用户可即时按需访问，推理速度超过 1000 tokens/秒。这是 OpenAI 首个专为安全分类设计的开源推理模型，支持用户自定义策略，并能在数分钟内投入生产。

GPT-OSS-Safeguard-20B 基于 OpenAI 的 GPT-OSS-20B 微调而来，专用于安全场景。它采用安全优先推理方式，能够遵循用户提供的明确策略并解释其决策过程。简而言之，该模型提供基于推理的分类结果而非原始分数，大大简化了调试与合规工作。

在 GroqCloud 上，信任与安全团队可获得以下核心功能：自带策略（BYOP）——加载任何分类体系、定义集或阈值，模型将据此推理；可配置推理力度（低/中/高）——在单次请求中平衡延迟与分析深度；完整推理轨迹——返回思维链，便于审计与调试；提示缓存——相同策略提示可在数百万次调用中重用，显著降低延迟与成本，缓存 token 折扣高达 50%；以及 128k token 上下文窗口，支持长文档或多轮对话处理。

在性价比方面，Groq 的专用堆栈为 OpenAI 的新安全模型优化了每 token 成本，同时保持速度与准确率。GPT-OSS-Safeguard-20B 在 GroqCloud 上的速度达 1000+ t/s，定价与基础 GPT-OSS-20B 相同：输入 token $0.075/M，输出 token $0.30/M。

该模型适用于多种真实场景：企业文档扫描——定义机密数据（PII、PHI、财务信息）策略，自动检测违规并解释原因；AI 聊天机器人——将安全策略嵌入系统提示，拦截或重写不安全输入；自动化政策审计——将现有规则作为“政策中的政策”输入，要求模型建议漏洞或改进；用户生成内容平台——对每个新帖子或评论运行模型，捕捉欺诈、违禁物品或误导性语言。

开发者可通过 GroqCloud Developer Console、Playground 和 API 立即试用 openai/gpt-oss-safeguard-20b。更多内容审核最佳实践，请参阅Groq开发者文档。