关于接下来会发生什么的一些想法,2026年5月
2026年AI领域将继续快速发展,开源模型在智能体能力上仍落后于闭源模型,谷歌的Gemini尚未对Claude Code和Codex构成有力竞争,美国开源模型正在崛起,Anthropic与OpenAI竞争激烈,现有权力结构开始介入AI发展。
文章情报
要点
- 开源模型在智能体能力上落后闭源模型约12个月。
- 谷歌Gemini在智能体工具方面无明显竞争优势。
- 美国开源模型(如Nemotron、Gemma)正迎头赶上。
- Anthropic和OpenAI将展开残酷竞争,推动AI应用两极分化。
为什么重要
这条新闻值得关注,因为开源模型在智能体能力上落后闭源模型约12个月。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
随着AI进步的步伐逐年加快,其带来的影响也逐渐显现。模型能力日益增强,我们的工作方式快速变化,AI的经济效应变得真实,同时现实世界的风险也日益突出。2026年将是第一个我认为不会有任何喘息机会的年份。需要警惕的是,情况很可能只会愈演愈烈——更多的颠覆、更多的惊喜、更高的风险。
本文讨论了几个关键趋势。首先,开源模型尚未迎来像Opus 4.5那样的智能体时刻。2025年12月,Opus 4.5在Claude Code中的出色表现昭示了闭源模型在智能体领域的领先地位,而以每月5美元的价格达到同等性能的开源模型尚未出现。我预计这个差距可能需要12个月甚至更久才能缩小。
其次,谷歌的Gemini在编程智能体领域仍无法与Claude Code和Codex匹敌。尽管Gemini 3.5 Flash有所改进,但尚无法替代现有工作流程。这让开源模型在自动化和低成本领域更具优势,而像Claude Code和Codex这样的工具正成为推动AI收入增长的主要动力。
第三,我预计今年不会出现开源版的Mythos。Mythos在软件工程和网络安全领域是一个里程碑,但中国实验室面临资源限制,无法像美国大型实验室那样扩展训练规模。美国公司(如谷歌、Meta、OpenAI、Anthropic)拥有的计算资源远超任何中国实验室。
第四,美国开源模型正在稳步发展。英伟达的Nemotron、谷歌的Gemma等模型正在收复失地。Gemma 4采用了Apache 2.0许可证,性能与同等规模的Qwen 3.5/3.6相当或更优,正在重新吸引开发者。
第五,Anthropic和OpenAI将进入残酷的迭代竞争。GPT 5.5和Codex App改变了工作方式,但Claude在写作等任务上仍具优势。AI正在推动企业走向两个极端:大型公司利用资源保持前沿优势,而像Interconnects这样的小型公司则依靠智能体细化并销售专业知识。
第六,更多现有权力结构将介入AI领域。教宗发布长文讨论AI,中国限制顶尖AI研究人员流动,美国将Anthropic列为供应链风险。这些权力实体意识到影响AI的窗口期有限,可能引发更多控制权的冲突。
最后,技术与社会将更加紧密地交织。美国国内的反AI情绪正在成为发展的最大障碍。许多人反对建设数据中心,而科技行业未能给予他们足够的发声机会。这预示着一个充满挑战的年份,行业需要更多元的声音和行动来避免社会冲突。我个人的选择是致力于建立一个充满活力的多元开源模型生态,并传播清晰、无偏见的信息。