AI News HubLIVE
站内改写2 分钟阅读

OpenAI 预览 GPT-5.6:Sol、Terra 和 Luna 分层模型,新增推理模式,限量访问

OpenAI 开始限量预览 GPT-5.6 系列,包括旗舰模型 Sol、生产级模型 Terra 和低成本快速模型 Luna。新增最大推理和超级模式,提升复杂任务处理能力。定价从每百万 tokens 1 美元起,性能在多项基准上创下新高。

来源MarkTechPost作者: Michal Sutter

OpenAI 已开始限量预览其下一代模型系列 GPT-5.6。该系列不再单一模型,而是分为三个命名层级:Sol、Terra 和 Luna。Sol 为旗舰模型,面向最复杂任务;Terra 针对日常生产工作;Luna 则是快速、低成本的选项。

此次预览通过 API 和 Codex 向一小部分可信合作伙伴开放。OpenAI 表示,他们已首先与美国政府分享了模型和计划。未来几周内,ChatGPT、Codex 和 API 将逐步获得更广泛的访问权限。

GPT-5.6 引入了分层模型、两种新的推理模式以及更强大的安全堆栈。分层架构允许每个层级独立更新,为开发者提供更清晰的智能、速度和成本选择。

两种新推理模式分别是 max 和 ultra。max 模式给予 Sol 最长的推理时间以深入思考;ultra 模式则通过子智能体协同工作来加速复杂任务。max 加深单一推理链,而 ultra 协调多个工作者处理同一任务,两者都以延迟和成本换取长期问题的准确性。

在基准测试中,Sol 在 Terminal-Bench 2.1 上创下新纪录,达到 91.91%(ultra 模式)和 88.76%(max 模式),超越之前的最佳模型。在 Agent's Last Exam 中,Sol 是唯一超过 50% 的模型(50.9%)。GeneBench v1 上,Sol 使用更少 token 超越 GPT-5.5。ExploitBench 上,Sol 以大约三分之一的输出 token 与 Mythos Preview 竞争。

定价方面(每百万 tokens):Sol 输入 $5、输出 $30;Terra 输入 $2.50、输出 $15;Luna 输入 $1、输出 $6。Sol 定价与 GPT-5.5 持平,Terra 便宜约一半。提示缓存现在支持显式缓存断点和 30 分钟最短期缓存寿命。OpenAI 还计划在七月让 Sol 在 Cerebras 硬件上运行,目标达到每秒 750 tokens。

用例包括:长期编码代理(Sol 适合多步骤 CLI 自动化)、高容量生产(Terra 适合大规模聊天和文档处理)、延迟敏感应用(Luna 适合自动补全和分类)、防御性安全(Sol 用于漏洞研究和修复)。

主要优势:清晰的分层、超子智能体模式、Terminal-Bench 最先进性能、token 效率提升、安全堆栈。开放问题:预览仅限约 20 个合作伙伴、公开基准细节有限、安全措施可能限制某些合法双重用途工作、定价高于某些开源模型、max 和 ultra 实际延迟未公开。