2026-05-15 10:15 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

OpenAI 開放安全模型首發支持

GroqCloud 宣佈即日起支持 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B，提供超過 1000 t/s 的推理速度。該模型專為安全分類工作負載設計，支持用户自定義策略、可配置推理力度及完整推理軌跡，適用於企業文檔掃描、AI 聊天機器人、政策審計和用户生成內容平台等場景。定價與基礎 GPT-OSS-20B 相同，輸入 token $0.075/M，輸出 token $0.30/M。

來源Groq Blog

GroqCloud 今日宣佈正式支持 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B，用户可即時按需訪問，推理速度超過 1000 tokens/秒。這是 OpenAI 首個專為安全分類設計的開源推理模型，支持用户自定義策略，並能在數分鐘內投入生產。

GPT-OSS-Safeguard-20B 基於 OpenAI 的 GPT-OSS-20B 微調而來，專用於安全場景。它採用安全優先推理方式，能夠遵循用户提供的明確策略並解釋其決策過程。簡而言之，該模型提供基於推理的分類結果而非原始分數，大大簡化了調試與合規工作。

在 GroqCloud 上，信任與安全團隊可獲得以下核心功能：自帶策略（BYOP）——加載任何分類體系、定義集或閾值，模型將據此推理；可配置推理力度（低/中/高）——在單次請求中平衡延遲與分析深度；完整推理軌跡——返回思維鏈，便於審計與調試；提示緩存——相同策略提示可在數百萬次調用中重用，顯著降低延遲與成本，緩存 token 折扣高達 50%；以及 128k token 上下文窗口，支持長文檔或多輪對話處理。

在性價比方面，Groq 的專用堆棧為 OpenAI 的新安全模型優化了每 token 成本，同時保持速度與準確率。GPT-OSS-Safeguard-20B 在 GroqCloud 上的速度達 1000+ t/s，定價與基礎 GPT-OSS-20B 相同：輸入 token $0.075/M，輸出 token $0.30/M。

該模型適用於多種真實場景：企業文檔掃描——定義機密數據（PII、PHI、財務信息）策略，自動檢測違規並解釋原因；AI 聊天機器人——將安全策略嵌入系統提示，攔截或重寫不安全輸入；自動化政策審計——將現有規則作為“政策中的政策”輸入，要求模型建議漏洞或改進；用户生成內容平台——對每個新帖子或評論運行模型，捕捉欺詐、違禁物品或誤導性語言。

開發者可通過 GroqCloud Developer Console、Playground 和 API 立即試用 openai/gpt-oss-safeguard-20b。更多內容審核最佳實踐，請參閲Groq開發者文檔。