OpenAI 開放安全模型首發支援
GroqCloud 宣佈即日起支援 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B,提供超過 1000 t/s 的推理速度。該模型專為安全分類工作負載設計,支援使用者自定義策略、可配置推理力度及完整推理軌跡,適用於企業文件掃描、AI 聊天機器人、政策審計和使用者生成內容平臺等場景。定價與基礎 GPT-OSS-20B 相同,輸入 token $0.075/M,輸出 token $0.30/M。
GroqCloud 今日宣佈正式支援 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B,使用者可即時按需訪問,推理速度超過 1000 tokens/秒。這是 OpenAI 首個專為安全分類設計的開源推理模型,支援使用者自定義策略,並能在數分鐘內投入生產。
GPT-OSS-Safeguard-20B 基於 OpenAI 的 GPT-OSS-20B 微調而來,專用於安全場景。它採用安全優先推理方式,能夠遵循使用者提供的明確策略並解釋其決策過程。簡而言之,該模型提供基於推理的分類結果而非原始分數,大大簡化了除錯與合規工作。
在 GroqCloud 上,信任與安全團隊可獲得以下核心功能:自帶策略(BYOP)——載入任何分類體系、定義集或閾值,模型將據此推理;可配置推理力度(低/中/高)——在單次請求中平衡延遲與分析深度;完整推理軌跡——返回思維鏈,便於審計與除錯;提示快取——相同策略提示可在數百萬次呼叫中重用,顯著降低延遲與成本,快取 token 折扣高達 50%;以及 128k token 上下文視窗,支援長文件或多輪對話處理。
在價效比方面,Groq 的專用堆疊為 OpenAI 的新安全模型最佳化了每 token 成本,同時保持速度與準確率。GPT-OSS-Safeguard-20B 在 GroqCloud 上的速度達 1000+ t/s,定價與基礎 GPT-OSS-20B 相同:輸入 token $0.075/M,輸出 token $0.30/M。
該模型適用於多種真實場景:企業文件掃描——定義機密資料(PII、PHI、財務資訊)策略,自動檢測違規並解釋原因;AI 聊天機器人——將安全策略嵌入系統提示,攔截或重寫不安全輸入;自動化政策審計——將現有規則作為“政策中的政策”輸入,要求模型建議漏洞或改進;使用者生成內容平臺——對每個新帖子或評論執行模型,捕捉欺詐、違禁物品或誤導性語言。
開發者可透過 GroqCloud Developer Console、Playground 和 API 立即試用 openai/gpt-oss-safeguard-20b。更多內容稽核最佳實踐,請參閱Groq開發者文件。