OpenAI 預覽 GPT-5.6:Sol、Terra 和 Luna 分層模型,新增推理模式,限量訪問
OpenAI 開始限量預覽 GPT-5.6 系列,包括旗艦模型 Sol、生產級模型 Terra 和低成本快速模型 Luna。新增最大推理和超級模式,提升複雜任務處理能力。定價從每百萬 tokens 1 美元起,效能在多項基準上創下新高。
OpenAI 已開始限量預覽其下一代模型系列 GPT-5.6。該系列不再單一模型,而是分為三個命名層級:Sol、Terra 和 Luna。Sol 為旗艦模型,面向最複雜任務;Terra 針對日常生產工作;Luna 則是快速、低成本的選項。
此次預覽透過 API 和 Codex 向一小部分可信合作伙伴開放。OpenAI 表示,他們已首先與美國政府分享了模型和計劃。未來幾周內,ChatGPT、Codex 和 API 將逐步獲得更廣泛的訪問許可權。
GPT-5.6 引入了分層模型、兩種新的推理模式以及更強大的安全堆疊。分層架構允許每個層級獨立更新,為開發者提供更清晰的智慧、速度和成本選擇。
兩種新推理模式分別是 max 和 ultra。max 模式給予 Sol 最長的推理時間以深入思考;ultra 模式則透過子智慧體協同工作來加速複雜任務。max 加深單一推理鏈,而 ultra 協調多個工作者處理同一任務,兩者都以延遲和成本換取長期問題的準確性。
在基準測試中,Sol 在 Terminal-Bench 2.1 上創下新紀錄,達到 91.91%(ultra 模式)和 88.76%(max 模式),超越之前的最佳模型。在 Agent's Last Exam 中,Sol 是唯一超過 50% 的模型(50.9%)。GeneBench v1 上,Sol 使用更少 token 超越 GPT-5.5。ExploitBench 上,Sol 以大約三分之一的輸出 token 與 Mythos Preview 競爭。
定價方面(每百萬 tokens):Sol 輸入 $5、輸出 $30;Terra 輸入 $2.50、輸出 $15;Luna 輸入 $1、輸出 $6。Sol 定價與 GPT-5.5 持平,Terra 便宜約一半。提示快取現在支援顯式快取斷點和 30 分鐘最短期快取壽命。OpenAI 還計劃在七月讓 Sol 在 Cerebras 硬體上執行,目標達到每秒 750 tokens。
用例包括:長期編碼代理(Sol 適合多步驟 CLI 自動化)、高容量生產(Terra 適合大規模聊天和文件處理)、延遲敏感應用(Luna 適合自動補全和分類)、防禦性安全(Sol 用於漏洞研究和修復)。
主要優勢:清晰的分層、超子智慧體模式、Terminal-Bench 最先進效能、token 效率提升、安全堆疊。開放問題:預覽僅限約 20 個合作伙伴、公開基準細節有限、安全措施可能限制某些合法雙重用途工作、定價高於某些開源模型、max 和 ultra 實際延遲未公開。