2026-06-27 03:18 UTC+8站内改写2 分钟阅读更新: 2026-06-27 03:47 UTC+8

OpenAI 预览 GPT-5.6：Sol、Terra 和 Luna 分层模型，新增推理模式，限量访问

OpenAI 开始限量预览 GPT-5.6 系列，包括旗舰模型 Sol、生产级模型 Terra 和低成本快速模型 Luna。新增最大推理和超级模式，提升复杂任务处理能力。定价从每百万 tokens 1 美元起，性能在多项基准上创下新高。

来源MarkTechPost作者: Michal Sutter

OpenAI 已开始限量预览其下一代模型系列 GPT-5.6。该系列不再单一模型，而是分为三个命名层级：Sol、Terra 和 Luna。Sol 为旗舰模型，面向最复杂任务；Terra 针对日常生产工作；Luna 则是快速、低成本的选项。

此次预览通过 API 和 Codex 向一小部分可信合作伙伴开放。OpenAI 表示，他们已首先与美国政府分享了模型和计划。未来几周内，ChatGPT、Codex 和 API 将逐步获得更广泛的访问权限。

GPT-5.6 引入了分层模型、两种新的推理模式以及更强大的安全堆栈。分层架构允许每个层级独立更新，为开发者提供更清晰的智能、速度和成本选择。

两种新推理模式分别是 max 和 ultra。max 模式给予 Sol 最长的推理时间以深入思考；ultra 模式则通过子智能体协同工作来加速复杂任务。max 加深单一推理链，而 ultra 协调多个工作者处理同一任务，两者都以延迟和成本换取长期问题的准确性。

在基准测试中，Sol 在 Terminal-Bench 2.1 上创下新纪录，达到 91.91%（ultra 模式）和 88.76%（max 模式），超越之前的最佳模型。在 Agent's Last Exam 中，Sol 是唯一超过 50% 的模型（50.9%）。GeneBench v1 上，Sol 使用更少 token 超越 GPT-5.5。ExploitBench 上，Sol 以大约三分之一的输出 token 与 Mythos Preview 竞争。

定价方面（每百万 tokens）：Sol 输入 $5、输出 $30；Terra 输入 $2.50、输出 $15；Luna 输入 $1、输出 $6。Sol 定价与 GPT-5.5 持平，Terra 便宜约一半。提示缓存现在支持显式缓存断点和 30 分钟最短期缓存寿命。OpenAI 还计划在七月让 Sol 在 Cerebras 硬件上运行，目标达到每秒 750 tokens。

用例包括：长期编码代理（Sol 适合多步骤 CLI 自动化）、高容量生产（Terra 适合大规模聊天和文档处理）、延迟敏感应用（Luna 适合自动补全和分类）、防御性安全（Sol 用于漏洞研究和修复）。

主要优势：清晰的分层、超子智能体模式、Terminal-Bench 最先进性能、token 效率提升、安全堆栈。开放问题：预览仅限约 20 个合作伙伴、公开基准细节有限、安全措施可能限制某些合法双重用途工作、定价高于某些开源模型、max 和 ultra 实际延迟未公开。