The Sequence Radar #865:上周AI回顾:Karpathy、Google、Colossus与即将到来的IPO浪潮
上周AI领域迎来重大转折:Google发布Gemini Omni及代理优先平台;Andrej Karpathy加入Anthropic,专注于利用Claude加速预训练研究;Anthropic与xAI达成价值450亿美元的Colossus算力租赁协议;Cerebras IPO成功,市值近950亿美元;SpaceX、OpenAI和Anthropic计划在未来六个月内相继上市,总估值可能超过3万亿美元。此外,多项前沿研究发布,包括HRM-Text高效预训练范式、AI评审员效果评估、NVIDIA的联合AR-扩散模型等。
文章情报
要点
- Google在I/O大会上推出Gemini Omni多模态模型和代理优先平台Antigravity,整合TPU 8i实现垂直集成。
- Andrej Karpathy加入Anthropic,组建团队利用Claude加速预训练研究,标志着自我改进循环的实质性进展。
- Anthropic与xAI签署价值450亿美元的Colossus算力租赁协议,开创竞争对手即供应商的新模式。
- Cerebras IPO首日暴涨,估值近950亿美元;SpaceX、OpenAI和Anthropic即将上市,总估值可能超过3万亿美元。
为什么重要
这条新闻值得关注,因为Google在I/O大会上推出Gemini Omni多模态模型和代理优先平台Antigravity,整合TPU 8i实现垂直集成。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
过去三周,人工智能领域经历了一场相变——不是基准分数上的微小变化,而是前沿AI的基础架构悄然重组,组织结构图和股权结构表已与四月时截然不同。
Google在I/O大会上定下了基调。桑达尔·皮查伊称之为“代理Gemini时代”,而这次营销文案与发布内容相符。Gemini Omni作为头条发布——一个以视频为核心、支持任意模态生成的多模态模型,在多模态编辑和世界理解方面迈出了实质性的一步——但更具影响力的发布是Gemini 3.5 Flash与Google Antigravity(其代理优先开发平台)的组合。核心宣传语从“帮助你写作的AI”转变为“帮助你行动的代理”。加上新的TPU 8i,Google现在拥有从芯片到IDE的垂直集成代理管道。这是今年所有前沿实验室中迄今为止最完整的代理故事。
5月19日,Andrej Karpathy加入Anthropic。他将与Nick Joseph合作研究预训练,官方说法是组建团队“利用Claude加速预训练研究”。仔细解读:一位OpenAI联合创始人正在构建一个循环,用当前的Claude改进下一个Claude。过去两年所有实验室在白板上勾画的自我改进飞轮,现在由最合适的人来实际编译。这次招聘的信号噪声比异常高——而Anthropic将数十亿美元公司的CTO拉入独立贡献者研究席位的更广泛模式,是未被充分注意的次要故事。
结合算力方面的信息,这次招聘更合理了。两周前(5月6日),Anthropic宣布获得xAI Colossus 1的完全访问权限——超过300兆瓦,约22万块H100、H200和GB200 GPU——以缓解此前导致Pro和Max速率限制的压力。价格在两周后SpaceX的S-1文件中浮出水面:每月12.5亿美元,持续到2029年5月,总计约450亿美元,并计划扩展到Colossus 2,且对轨道计算表示兴趣。竞争对手作为供应商的拓扑结构是新的,推理工作负载的单位经济性现在包括“我可以从一家发射公司租赁多少兆瓦?”
公开市场已经为此转变定价。5月14日,Cerebras在纳斯达克上市,定价185美元,开盘350美元,首日收盘市值近950亿美元——自Uber以来最大的科技IPO,订单簿据称超额认购20倍。头条是股价飙升;有趣的项目在S-1文件内部:246亿美元的积压订单;与OpenAI签署的价值超过200亿美元的多年代理协议,提供750兆瓦推理容量;来自AWS的CS-3系统约束性条款清单。两家阿联酋关联客户约占2025年收入的86%,因此集中风险是真实存在的,但来自公开市场的信号明确无误:专用推理硅,以长期容量出售,现在的定价像基础设施,而不是像一家芯片公司。Cerebras是预演。
主菜是背后的IPO三连击。SpaceX的S-1指向1.75-2万亿美元估值;据报道OpenAI将在几天内秘密提交文件,估值8500亿至1万亿美元;Anthropic计划10月上市,估值约9000亿美元。历史上最大的三个科技IPO,都依赖于相同的底层计算基板,都将在六个月内冲击公开市场。我们即将获得前沿本身实时的按市值计价估值函数。
对我来说,结论是:前沿不再只是研究产物——它是一个垂直集成的资本结构。算力是可交易的供应合同。人才在实验室间流动。护城河不再是“谁有最好的损失曲线”,而是“谁能资助450亿美元的算力租赁,招募能够压缩这些租赁的人才,并在季度审查下保持公开股权故事的连贯性”。
接下来的十八个月不会由基准测试决定,而是由资产负债表决定。
🔎 研究亮点
**HRM-Text:超越规模的高效预训练** AI实验室:Sapient Intelligence & MIT 简介:本文提出HRM-Text,一种高效预训练范式,用双时间尺度分层循环模型(HRM)替代标准Transformer,大幅减少训练大语言模型所需的计算和数据量。通过结合任务完成目标(仅使用指令-响应对训练),该模型在比当代基础模型少用900倍token的情况下取得了具有竞争力的基准性能。
**AI评审员的局限与机遇:45位专家评审Nature家族论文** AI实验室:卡内基梅隆大学 简介:本研究评估了AI生成同行评审的实际效果,由45位领域科学家手动评估来自82篇Nature家族论文的2960条具体评论。结果显示,前沿AI模型能提出高度显著且证据充分的批评,但往往缺乏子领域特定背景,且彼此高度重叠,表明它们目前最适合增强而非取代人类评审者。
**Nemotron-Labs-Diffusion:统一自回归、扩散和自推测解码的三模态语言模型** AI实验室:NVIDIA 简介:本技术报告提出Nemotron-Labs-Diffusion,一个使用联合目标训练的语言模型,在单一架构中无缝统一了自回归(AR)、扩散和自推测解码能力。作者证明AR和扩散训练是互补的,使模型能够利用自推测(扩散草稿,AR验证)在各种部署场景中实现更高的吞吐量和效率,而无需依赖多token预测(MTP)方法。
**用于扩散对齐的缝合价值模型** AI实验室:Google & ETH Zürich 简介:本文提出StitchVM,一种轻量级模型缝合框架,将冻结的扩散骨干网络与预训练的像素空间奖励模型连接,为噪声潜变量高效创建强大的价值模型。通过直接评估噪声潜变量,而非依赖昂贵的Tweedie或蒙特卡洛近似,StitchVM显著加速了推理时间和训练时间的扩散对齐方法,同时保持或改进生成质量。
**Spreadsheet-RL:通过强化学习推进大语言模型在真实电子表格任务中的表现** AI实验室:伊利诺伊大学厄巴纳-香槟分校 & Meta 简介:本文提出Spreadsheet-RL,一个面向策略的强化学习框架,用于在逼真的Microsoft Excel环境中训练专门的AI代理处理复杂电子表格工作流。通过结合自动化数据收集管道和结构化工具集,该框架显著提升了开源模型在通用和领域特定基准上执行多步电子表格任务的能力。
🤖 科技发布
**Google AI公告** Google在I/O大会上发布多项AI公告,包括令人惊叹的Gemini Omni。
**Qwen Max 3.7** Qwen开源了其最新旗舰模型。
**MagenticLite、MagenticBrain、Fara1.5** Microsoft发布了MagenticLite(用于浏览器和文件系统的代理应用),以及MagenticBrain和Fara(针对计算机使用任务优化的小模型)。
📡 你必须了解的10条AI新闻
- **Hark完成7亿美元A轮融资,估值60亿美元**——Brett Adcock的隐秘AI实验室Hark由Parkway Venture Capital领投7亿美元A轮,投后估值60亿美元,Nvidia、AMD Ventures、Qualcomm Ventures、Salesforce Ventures等参投,旨在构建多模态个人AI模型(今年夏天)及后续定制的“通用界面”硬件。
- **NanoCo (NanoClaw) 完成1200万美元种子轮融资,拒绝约2000万美元收购**——Cohen兄弟的安全专注、沙盒化OpenClaw替代品NanoClaw在开源项目启动六周后,完成超额认购的1200万美元种子轮,由Valley Capital Partners领投(Docker、Vercel、monday.com、Slow Ventures和Hugging Face的Clem Delangue参投),该项目曾通过Karpathy和新加坡外长走红。
- **Andrej Karpathy加入Anthropic从事预训练**——Karpathy加入Anthropic,组建团队利用Claude加速预训练研究,在特斯拉、OpenAI和Eureka Labs后重返前沿LLM研发。
- **Anthropic收购Stainless**——Anthropic收购了SDK生成初创公司Stainless,其工具为所有官方Anthropic SDK提供支持,也被OpenAI、Google、Replicate、Runway和Cloudflare使用;Anthropic将关闭所有托管的Stainless产品,将SDK工具独占(交易条款未披露;The Information此前估价超过3亿美元)。
- **Ocean以2800万美元融资走出隐身模式,专注代理邮件安全**——以色列创始人Shay Shwartz和Oran Moyal以2800万美元总融资推出Ocean,由Lightspeed领投(Picture、Cerca及天使投资人Assaf Rappaport、Yevgeny Dibrov、Nadir Izrael参投),其多代理邮件调查平台针对AI生成钓鱼攻击。
- **Manus考虑10亿美元融资以解除Meta收购**——Manus的三位中国联合创始人(肖弘、季逸超、张涛)正在探索从外部投资者处筹集约10亿美元,估值与Meta支付的超过20亿美元相匹配,可能使用个人资本,以遵守北京方面解除十二月交易的要求——中国合资架构和香港IPO可能是下一步。
- **SpaceX公开提交纳斯达克IPO申请,代码SPCX**——SpaceX于5月20日公开提交S-1文件,将是史上最大IPO(目标募集约750亿美元,估值约1.75万亿美元),在纳斯达克上市,代码SPCX,采用超级投票权结构以确保马斯克的控制权,尽管存在数十亿美元亏损和413亿美元累计赤字。
- **OpenAI准备在几天或几周内提交IPO文件**——据WSJ和Bloomberg报道,OpenAI正与高盛和摩根士丹利合作秘密起草S-1,可能最快本周五提交,目标9月公开上市,估值超过8500亿美元——在马斯克诉讼因诉讼时效被驳回后快速推进。
- **Exa完成2.5亿美元C轮融资,估值22亿美元**——Exa Labs完成由Andreessen Horowitz领投的2.5亿美元C轮,估值22亿美元(较去年秋天的7亿美元估值增长两倍多),用于扩展其代理优化网络搜索API、训练下一代检索模型,并处理其5000亿+URL索引中每秒数十万次搜索。