AI News HubLIVE
站內改寫1 分鐘閱讀

OpenAI 開放安全模型首發支持

GroqCloud 宣佈即日起支持 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B,提供超過 1000 t/s 的推理速度。該模型專為安全分類工作負載設計,支持用户自定義策略、可配置推理力度及完整推理軌跡,適用於企業文檔掃描、AI 聊天機器人、政策審計和用户生成內容平台等場景。定價與基礎 GPT-OSS-20B 相同,輸入 token $0.075/M,輸出 token $0.30/M。

來源Groq Blog

GroqCloud 今日宣佈正式支持 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B,用户可即時按需訪問,推理速度超過 1000 tokens/秒。這是 OpenAI 首個專為安全分類設計的開源推理模型,支持用户自定義策略,並能在數分鐘內投入生產。

GPT-OSS-Safeguard-20B 基於 OpenAI 的 GPT-OSS-20B 微調而來,專用於安全場景。它採用安全優先推理方式,能夠遵循用户提供的明確策略並解釋其決策過程。簡而言之,該模型提供基於推理的分類結果而非原始分數,大大簡化了調試與合規工作。

在 GroqCloud 上,信任與安全團隊可獲得以下核心功能:自帶策略(BYOP)——加載任何分類體系、定義集或閾值,模型將據此推理;可配置推理力度(低/中/高)——在單次請求中平衡延遲與分析深度;完整推理軌跡——返回思維鏈,便於審計與調試;提示緩存——相同策略提示可在數百萬次調用中重用,顯著降低延遲與成本,緩存 token 折扣高達 50%;以及 128k token 上下文窗口,支持長文檔或多輪對話處理。

在性價比方面,Groq 的專用堆棧為 OpenAI 的新安全模型優化了每 token 成本,同時保持速度與準確率。GPT-OSS-Safeguard-20B 在 GroqCloud 上的速度達 1000+ t/s,定價與基礎 GPT-OSS-20B 相同:輸入 token $0.075/M,輸出 token $0.30/M。

該模型適用於多種真實場景:企業文檔掃描——定義機密數據(PII、PHI、財務信息)策略,自動檢測違規並解釋原因;AI 聊天機器人——將安全策略嵌入系統提示,攔截或重寫不安全輸入;自動化政策審計——將現有規則作為“政策中的政策”輸入,要求模型建議漏洞或改進;用户生成內容平台——對每個新帖子或評論運行模型,捕捉欺詐、違禁物品或誤導性語言。

開發者可通過 GroqCloud Developer Console、Playground 和 API 立即試用 openai/gpt-oss-safeguard-20b。更多內容審核最佳實踐,請參閲Groq開發者文檔。