2026-05-15 11:15 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

OpenAIオープンセーフティモデルのデイゼロサポート

GroqCloudは、OpenAIの最新オープンソースセーフティモデルGPT-OSS-Safeguard-20Bを即日サポートし、1000 t/s超の推論速度を提供します。このモデルはセーフティ分類ワークロード向けに設計され、独自ポリシーの持ち込み、設定可能な推論努力、完全な推論トレースを備え、コストはベースモデルと同じです。

ソースGroq Blog

GroqCloudは本日、OpenAIの最新オープンソースセーフティモデルGPT-OSS-Safeguard-20Bの即時サポートを発表しました。ユーザーはオンデマンドでアクセスでき、推論速度は1000トークン/秒を超えます。このモデルは、OpenAI初のセーフティ分類専用オープンウェイト推論モデルであり、独自のポリシーを数分で本番環境に導入できます。

GPT-OSS-Safeguard-20Bは、OpenAIのGPT-OSS-20Bを微調整したもので、セーフティユースケース向けに構築されています。セーフティファーストの推論を採用し、ユーザーが提供する明示的なポリシーに従い、その決定を説明します。要するに、このモデルは生のスコアではなく推論ベースの分類結果を提供し、デバッグとコンプライアンスを大幅に容易にします。

GroqCloudで利用可能なトラスト＆セーフティチーム向けのコア機能は次のとおりです：独自ポリシーの持ち込み（BYOP）—任意の分類法、定義セット、しきい値をロードし、モデルがそれに基づいて推論；設定可能な推論努力（低/中/高）—リクエストごとにレイテンシと分析深度をトレードオフ；完全な推論トレース—思考連鎖を返し、監査とデバッグに役立つ；プロンプトキャッシング—同じポリシープロンプトを数百万回の呼び出しで再利用し、レイテンシとコストを削減（キャッシュトークンは最大50%割引）；128kトークンコンテキストウィンドウ—長文書やマルチターン会話を処理可能。

価格性能面では、Groqの専用スタックがOpenAIの新しいセーフティモデル向けにトークンあたりのコストを最適化し、速度と精度を維持します。GPT-OSS-Safeguard-20BはGroqCloud上で1000+ t/sで動作し、価格はベースのGPT-OSS-20Bと同じ：入力トークン$0.075/M、出力トークン$0.30/Mです。

このモデルはさまざまな実世界のシナリオに適しています：エンタープライズドキュメントスキャン—機密データ（PII、PHI、財務情報）のポリシーを定義し、PDFやメールをモデルに送信して違反をフラグ付けし理由を説明；AI搭載チャットボット—会話エージェントのシステムプロンプトにセーフティポリシーを埋め込み、不安全なユーザー入力をブロックまたは書き換え；自動ポリシー監査—既存のモデレーションルールを「ポリシーインポリシー」としてモデルに入力し、ギャップや矛盾、改善点を提案させる；ユーザー生成コンテンツプラットフォーム—フォーラムやレビューサイトで、各新規投稿やコメントをモデルでチェックし、詐欺や禁止商品、欺瞞的な表現を捕捉。

開発者はGroqCloud Developer Console、Playground、APIからopenai/gpt-oss-safeguard-20bをすぐに試せます。コンテンツモデレーションのベストプラクティスについては、Groqの開発者ドキュメントをご覧ください。