OpenAI、GPT-5.6をプレビュー:Sol、Terra、Lunaの階層型モデル、新推論モード、限定アクセス
OpenAIは次世代モデルシリーズGPT-5.6の限定プレビューを開始。旗艦モデルSol、本番用Terra、高速低コストのLunaの3層構成。新たな推論モード(max、ultra)を追加し、複雑なタスク処理を強化。料金は100万トークンあたり1ドルから。複数のベンチマークで最高性能を達成。
OpenAIは、次世代モデルシリーズGPT-5.6の限定プレビューを開始しました。このシリーズは単一モデルではなく、Sol(旗艦)、Terra(本番環境向け)、Luna(高速・低コスト)の3つの階層に分かれています。Solは最も難しいタスクを対象とし、Terraは日常的な本番作業、Lunaは高速でルーティンなタスクに最適化されています。
プレビューはAPIとCodexを通じて少数の信頼できるパートナーに限定されています。OpenAIは、まず米国政府とモデルおよび計画を共有したと述べています。今後数週間でChatGPT、Codex、APIへのアクセスが段階的に拡大される予定です。
GPT-5.6の主な変更点は、階層型モデル、2つの新しい推論モード、そして強化された安全スタックです。階層構造により、各層が独立して更新可能となり、開発者は知能、速度、コストをより明確に選択できます。
新しい推論モードはmaxとultraの2つです。maxモードはSolに最も長い推論時間を与え、深い思考を可能にします。ultraモードはサブエージェントを活用し、複雑な作業を分割して並列処理します。maxが単一の思考連鎖を深めるのに対し、ultraは複数の作業者を調整してタスクを高速化します。
ベンチマークでは、SolがTerminal-Bench 2.1で新記録(ultraモード91.91%、maxモード88.76%)を達成し、従来の最高モデルを上回りました。Agent's Last ExamではSolが唯一50%を超え(コードモードで50.9%)、GeneBench v1ではGPT-5.5より少ないトークンで優れた結果を示しました。ExploitBenchでは、SolはMythos Previewと同等の性能を約3分の1の出力トークンで達成しました。
価格(100万トークンあたり):Sol入力5ドル/出力30ドル、Terra入力2.50ドル/出力15ドル、Luna入力1ドル/出力6ドル。Solの価格はGPT-5.5と同等ですが、Terraは約半額です。プロンプトキャッシュは明示的なキャッシュブレークポイントと30分の最小キャッシュ寿命をサポートするようになりました。OpenAIは7月にSolをCerebrasハードウェアで実行し、毎秒750トークンを目標としています。
ユースケース:長期コーディングエージェント(Solは多段階CLI自動化に最適)、高ボリューム本番業務(Terraは大規模チャットや文書処理)、レイテンシー重視アプリ(Lunaはオートコンプリートや分類)、防御的セキュリティ(Solは脆弱性調査とパッチ適用)などがあります。
主な強み:明確な階層化、ultraサブエージェントモード、Terminal-Benchでの最高性能、トークン効率の向上、文書化された安全スタック。未解決の課題:プレビューが約20パートナーに限定、公開ベンチマーク詳細が限定的、安全対策が正当なデュアルユースセキュリティ作業を妨げる可能性、一部オープンウェイト競合より高価格、maxおよびultraの実世界レイテンシーが未公開。