2026-05-23 12:21 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

【AINews】所有模型实验室现在都是智能体实验室

在OpenAI即将上市之际，行业巨头纷纷从纯模型转向智能体产品。DeepSeek永久降价75%，MCP协议简化，谷歌推出全天候智能体，Anthropic发现上万高危漏洞。智能体化成为AI新常态。

在OpenAI即将于下周提交IPO申请之际，该公司联合创始人Greg Brockman发表了一系列评论，表明模型实验室正越来越多地同时构建智能体产品。这一立场与之前“大模型团队”成员的普遍观点形成鲜明对比，包括OpenAI实验室前负责人。

与此同时，AI21工作室关闭了模型团队，全面转向智能体开发；就连一向专注于模型的DeepSeek也首次组建了“Harness团队”。这印证了“系统优于模型”的观点，但有一个微妙之处：与智能体协同训练的模型可能会进一步限制模型访问权限——如果模型经过后期训练后只能与封闭源代码的智能体有效配合，那么大部分用户将被引导至智能体产品，削弱模型/API的竞争关系。

在产品层面，智能体化趋势明显：OpenAI通过“Codex Thursday No.6”更新了Codex，新增应用截图、目标改进、远程计算机使用、注释模式、插件共享和分析功能。用户表示编码方式发生根本性改变，有人已一个月未打开IDE。同时，Claude Devs将自动模式扩展至Pro计划并支持Sonnet 4.6。

在模型性能与成本方面，DeepSeek的降价是最强的市场信号。其V4 Pro模型永久降价75%，使推理成本降至约0.18美元/百万token，比Gemini 3.1 Pro Preview低约3倍，比GPT-5.5低12倍，比Claude Opus 4.7低19倍。社区认为其正在推动“智能体价格低到无法计量”的时代。

协议和基础设施方面，MCP协议发布2026-07-28候选版本，核心变化是无状态化——无需握手和会话ID，任何请求可访问任何服务器实例。这使得扩展和负载均衡更加简单。此外，沙盒和托管执行成为一级原语：CoreWeave推出公开预览版Sandboxes，Cloudsail提供每任务沙盒，NVIDIA开源AI-Q智能体技能等。

研究方面，RL后训练和奖励设计正在被重新审视：Vector Policy Optimization（VPO）通过优化向量奖励而非标量奖励来改善测试时扩展性能。智能体编译/蒸馏成为一个重要经济概念——复杂智能体工作流可被蒸馏成权重，以约100倍低的推理成本运行，同时保持接近前沿质量。

多模态系统方面，谷歌I/O大会推出了Gemini Spark全天候个人AI智能体，以及Project Genie + Street View将真实地点转化为可交互世界。Runway发布Aleph 2.0，支持多镜头序列至30秒1080p。语音和图像生成也有显著进步。

网络安全领域，Anthropic的Project Glasswing在一个月内发现超过一万个高危或严重漏洞，并警告行业需适应新漏洞规模。Perplexity开源了Bumblebee扫描器。美国移民政策变化引发AI领袖强烈反对，认为将损害高技能人才管道和AI竞争力。