AI News HubLIVE
站内改写

【AINews】所有模型实验室现在都是智能体实验室

在OpenAI即将上市之际,行业巨头纷纷从纯模型转向智能体产品。DeepSeek永久降价75%,MCP协议简化,谷歌推出全天候智能体,Anthropic发现上万高危漏洞。智能体化成为AI新常态。

文章情报

工程师进阶

要点

  • Greg Brockman表示模型不再是产品,模型+智能体+工作流才是关键
  • DeepSeek V4 Pro永久降价75%,推理成本大幅降低
  • MCP协议推出无状态版本,简化基础设施
  • Anthropic的Project Glasswing一个月内发现上万高危漏洞
  • 谷歌推出Gemini Spark全天候个人AI智能体

为什么重要

这条新闻值得关注,因为Greg Brockman表示模型不再是产品,模型+智能体+工作流才是关键。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

在OpenAI即将于下周提交IPO申请之际,该公司联合创始人Greg Brockman发表了一系列评论,表明模型实验室正越来越多地同时构建智能体产品。这一立场与之前“大模型团队”成员的普遍观点形成鲜明对比,包括OpenAI实验室前负责人。

与此同时,AI21工作室关闭了模型团队,全面转向智能体开发;就连一向专注于模型的DeepSeek也首次组建了“Harness团队”。这印证了“系统优于模型”的观点,但有一个微妙之处:与智能体协同训练的模型可能会进一步限制模型访问权限——如果模型经过后期训练后只能与封闭源代码的智能体有效配合,那么大部分用户将被引导至智能体产品,削弱模型/API的竞争关系。

在产品层面,智能体化趋势明显:OpenAI通过“Codex Thursday No.6”更新了Codex,新增应用截图、目标改进、远程计算机使用、注释模式、插件共享和分析功能。用户表示编码方式发生根本性改变,有人已一个月未打开IDE。同时,Claude Devs将自动模式扩展至Pro计划并支持Sonnet 4.6。

在模型性能与成本方面,DeepSeek的降价是最强的市场信号。其V4 Pro模型永久降价75%,使推理成本降至约0.18美元/百万token,比Gemini 3.1 Pro Preview低约3倍,比GPT-5.5低12倍,比Claude Opus 4.7低19倍。社区认为其正在推动“智能体价格低到无法计量”的时代。

协议和基础设施方面,MCP协议发布2026-07-28候选版本,核心变化是无状态化——无需握手和会话ID,任何请求可访问任何服务器实例。这使得扩展和负载均衡更加简单。此外,沙盒和托管执行成为一级原语:CoreWeave推出公开预览版Sandboxes,Cloudsail提供每任务沙盒,NVIDIA开源AI-Q智能体技能等。

研究方面,RL后训练和奖励设计正在被重新审视:Vector Policy Optimization(VPO)通过优化向量奖励而非标量奖励来改善测试时扩展性能。智能体编译/蒸馏成为一个重要经济概念——复杂智能体工作流可被蒸馏成权重,以约100倍低的推理成本运行,同时保持接近前沿质量。

多模态系统方面,谷歌I/O大会推出了Gemini Spark全天候个人AI智能体,以及Project Genie + Street View将真实地点转化为可交互世界。Runway发布Aleph 2.0,支持多镜头序列至30秒1080p。语音和图像生成也有显著进步。

网络安全领域,Anthropic的Project Glasswing在一个月内发现超过一万个高危或严重漏洞,并警告行业需适应新漏洞规模。Perplexity开源了Bumblebee扫描器。美国移民政策变化引发AI领袖强烈反对,认为将损害高技能人才管道和AI竞争力。