OpenAIオープンセーフティモデルのデイゼロサポート
GroqCloudは、OpenAIの最新オープンソースセーフティモデルGPT-OSS-Safeguard-20Bを即日サポートし、1000 t/s超の推論速度を提供します。このモデルはセーフティ分類ワークロード向けに設計され、独自ポリシーの持ち込み、設定可能な推論努力、完全な推論トレースを備え、コストはベースモデルと同じです。
GroqCloudは本日、OpenAIの最新オープンソースセーフティモデルGPT-OSS-Safeguard-20Bの即時サポートを発表しました。ユーザーはオンデマンドでアクセスでき、推論速度は1000トークン/秒を超えます。このモデルは、OpenAI初のセーフティ分類専用オープンウェイト推論モデルであり、独自のポリシーを数分で本番環境に導入できます。
GPT-OSS-Safeguard-20Bは、OpenAIのGPT-OSS-20Bを微調整したもので、セーフティユースケース向けに構築されています。セーフティファーストの推論を採用し、ユーザーが提供する明示的なポリシーに従い、その決定を説明します。要するに、このモデルは生のスコアではなく推論ベースの分類結果を提供し、デバッグとコンプライアンスを大幅に容易にします。
GroqCloudで利用可能なトラスト&セーフティチーム向けのコア機能は次のとおりです:独自ポリシーの持ち込み(BYOP)—任意の分類法、定義セット、しきい値をロードし、モデルがそれに基づいて推論;設定可能な推論努力(低/中/高)—リクエストごとにレイテンシと分析深度をトレードオフ;完全な推論トレース—思考連鎖を返し、監査とデバッグに役立つ;プロンプトキャッシング—同じポリシープロンプトを数百万回の呼び出しで再利用し、レイテンシとコストを削減(キャッシュトークンは最大50%割引);128kトークンコンテキストウィンドウ—長文書やマルチターン会話を処理可能。
価格性能面では、Groqの専用スタックがOpenAIの新しいセーフティモデル向けにトークンあたりのコストを最適化し、速度と精度を維持します。GPT-OSS-Safeguard-20BはGroqCloud上で1000+ t/sで動作し、価格はベースのGPT-OSS-20Bと同じ:入力トークン$0.075/M、出力トークン$0.30/Mです。
このモデルはさまざまな実世界のシナリオに適しています:エンタープライズドキュメントスキャン—機密データ(PII、PHI、財務情報)のポリシーを定義し、PDFやメールをモデルに送信して違反をフラグ付けし理由を説明;AI搭載チャットボット—会話エージェントのシステムプロンプトにセーフティポリシーを埋め込み、不安全なユーザー入力をブロックまたは書き換え;自動ポリシー監査—既存のモデレーションルールを「ポリシーインポリシー」としてモデルに入力し、ギャップや矛盾、改善点を提案させる;ユーザー生成コンテンツプラットフォーム—フォーラムやレビューサイトで、各新規投稿やコメントをモデルでチェックし、詐欺や禁止商品、欺瞞的な表現を捕捉。
開発者はGroqCloud Developer Console、Playground、APIからopenai/gpt-oss-safeguard-20bをすぐに試せます。コンテンツモデレーションのベストプラクティスについては、Groqの開発者ドキュメントをご覧ください。