AI News HubLIVE
站内改写

The Sequence Radar #865:上週AI回顧:Karpathy、Google、Colossus與即將到來的IPO浪潮

上週AI領域迎來重大轉折:Google發佈Gemini Omni及代理優先平台;Andrej Karpathy加入Anthropic,專注於利用Claude加速預訓練研究;Anthropic與xAI達成價值450億美元的Colossus算力租賃協議;Cerebras IPO成功,市值近950億美元;SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市,總估值可能超過3萬億美元。此外,多項前沿研究發佈,包括HRM-Text高效預訓練範式、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。

文章情報

投資人進階

要點

  • Google在I/O大會上推出Gemini Omni多模態模型和代理優先平台Antigravity,整合TPU 8i實現垂直集成。
  • Andrej Karpathy加入Anthropic,組建團隊利用Claude加速預訓練研究,標誌着自我改進循環的實質性進展。
  • Anthropic與xAI簽署價值450億美元的Colossus算力租賃協議,開創競爭對手即供應商的新模式。
  • Cerebras IPO首日暴漲,估值近950億美元;SpaceX、OpenAI和Anthropic即將上市,總估值可能超過3萬億美元。

為甚麼重要

這條新聞值得關注,因為Google在I/O大會上推出Gemini Omni多模態模型和代理優先平台Antigravity,整合TPU 8i實現垂直集成。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

過去三週,人工智能領域經歷了一場相變——不是基準分數上的微小變化,而是前沿AI的基礎架構悄然重組,組織結構圖和股權結構表已與四月時截然不同。

Google在I/O大會上定下了基調。桑達爾·皮查伊稱之為“代理Gemini時代”,而這次營銷文案與發佈內容相符。Gemini Omni作為頭條發佈——一個以視頻為核心、支持任意模態生成的多模態模型,在多模態編輯和世界理解方面邁出了實質性的一步——但更具影響力的發佈是Gemini 3.5 Flash與Google Antigravity(其代理優先開發平台)的組合。核心宣傳語從“幫助你寫作的AI”轉變為“幫助你行動的代理”。加上新的TPU 8i,Google現在擁有從芯片到IDE的垂直集成代理管道。這是今年所有前沿實驗室中迄今為止最完整的代理故事。

5月19日,Andrej Karpathy加入Anthropic。他將與Nick Joseph合作研究預訓練,官方説法是組建團隊“利用Claude加速預訓練研究”。仔細解讀:一位OpenAI聯合創始人正在構建一個循環,用當前的Claude改進下一個Claude。過去兩年所有實驗室在白板上勾畫的自我改進飛輪,現在由最合適的人來實際編譯。這次招聘的信號噪聲比異常高——而Anthropic將數十億美元公司的CTO拉入獨立貢獻者研究席位的更廣泛模式,是未被充分注意的次要故事。

結合算力方面的信息,這次招聘更合理了。兩週前(5月6日),Anthropic宣佈獲得xAI Colossus 1的完全訪問權限——超過300兆瓦,約22萬塊H100、H200和GB200 GPU——以緩解此前導致Pro和Max速率限制的壓力。價格在兩週後SpaceX的S-1文件中浮出水面:每月12.5億美元,持續到2029年5月,總計約450億美元,並計劃擴展到Colossus 2,且對軌道計算表示興趣。競爭對手作為供應商的拓撲結構是新的,推理工作負載的單位經濟性現在包括“我可以從一家發射公司租賃多少兆瓦?”

公開市場已經為此轉變定價。5月14日,Cerebras在納斯達克上市,定價185美元,開盤350美元,首日收盤市值近950億美元——自Uber以來最大的科技IPO,訂單簿據稱超額認購20倍。頭條是股價飆升;有趣的項目在S-1文件內部:246億美元的積壓訂單;與OpenAI簽署的價值超過200億美元的多年代理協議,提供750兆瓦推理容量;來自AWS的CS-3系統約束性條款清單。兩家阿聯酋關聯客户約佔2025年收入的86%,因此集中風險是真實存在的,但來自公開市場的信號明確無誤:專用推理硅,以長期容量出售,現在的定價像基礎設施,而不是像一家芯片公司。Cerebras是預演。

主菜是背後的IPO三連擊。SpaceX的S-1指向1.75-2萬億美元估值;據報道OpenAI將在幾天內秘密提交文件,估值8500億至1萬億美元;Anthropic計劃10月上市,估值約9000億美元。歷史上最大的三個科技IPO,都依賴於相同的底層計算基板,都將在六個月內衝擊公開市場。我們即將獲得前沿本身實時的按市值計價估值函數。

對我來説,結論是:前沿不再只是研究產物——它是一個垂直集成的資本結構。算力是可交易的供應合同。人才在實驗室間流動。護城河不再是“誰有最好的損失曲線”,而是“誰能資助450億美元的算力租賃,招募能夠壓縮這些租賃的人才,並在季度審查下保持公開股權故事的連貫性”。

接下來的十八個月不會由基準測試決定,而是由資產負債表決定。

🔎 研究亮點

**HRM-Text:超越規模的高效預訓練** AI實驗室:Sapient Intelligence & MIT 簡介:本文提出HRM-Text,一種高效預訓練範式,用雙時間尺度分層循環模型(HRM)替代標準Transformer,大幅減少訓練大語言模型所需的計算和數據量。通過結合任務完成目標(僅使用指令-響應對訓練),該模型在比當代基礎模型少用900倍token的情況下取得了具有競爭力的基準性能。

**AI評審員的侷限與機遇:45位專家評審Nature家族論文** AI實驗室:卡內基梅隆大學 簡介:本研究評估了AI生成同行評審的實際效果,由45位領域科學家手動評估來自82篇Nature家族論文的2960條具體評論。結果顯示,前沿AI模型能提出高度顯著且證據充分的批評,但往往缺乏子領域特定背景,且彼此高度重疊,表明它們目前最適合增強而非取代人類評審者。

**Nemotron-Labs-Diffusion:統一自迴歸、擴散和自推測解碼的三模態語言模型** AI實驗室:NVIDIA 簡介:本技術報告提出Nemotron-Labs-Diffusion,一個使用聯合目標訓練的語言模型,在單一架構中無縫統一了自迴歸(AR)、擴散和自推測解碼能力。作者證明AR和擴散訓練是互補的,使模型能夠利用自推測(擴散草稿,AR驗證)在各種部署場景中實現更高的吞吐量和效率,而無需依賴多token預測(MTP)方法。

**用於擴散對齊的縫合價值模型** AI實驗室:Google & ETH Zürich 簡介:本文提出StitchVM,一種輕量級模型縫合框架,將凍結的擴散骨幹網絡與預訓練的像素空間獎勵模型連接,為噪聲潛變量高效創建強大的價值模型。通過直接評估噪聲潛變量,而非依賴昂貴的Tweedie或蒙特卡洛近似,StitchVM顯著加速了推理時間和訓練時間的擴散對齊方法,同時保持或改進生成質量。

**Spreadsheet-RL:通過強化學習推進大語言模型在真實電子表格任務中的表現** AI實驗室:伊利諾伊大學厄巴納-香檳分校 & Meta 簡介:本文提出Spreadsheet-RL,一個面向策略的強化學習框架,用於在逼真的Microsoft Excel環境中訓練專門的AI代理處理複雜電子表格工作流。通過結合自動化數據收集管道和結構化工具集,該框架顯著提升了開源模型在通用和領域特定基準上執行多步電子表格任務的能力。

🤖 科技發佈

**Google AI公告** Google在I/O大會上發佈多項AI公告,包括令人驚歎的Gemini Omni。

**Qwen Max 3.7** Qwen開源了其最新旗艦模型。

**MagenticLite、MagenticBrain、Fara1.5** Microsoft發佈了MagenticLite(用於瀏覽器和文件系統的代理應用),以及MagenticBrain和Fara(針對計算機使用任務優化的小模型)。

📡 你必須瞭解的10條AI新聞

  1. **Hark完成7億美元A輪融資,估值60億美元**——Brett Adcock的隱秘AI實驗室Hark由Parkway Venture Capital領投7億美元A輪,投後估值60億美元,Nvidia、AMD Ventures、Qualcomm Ventures、Salesforce Ventures等參投,旨在構建多模態個人AI模型(今年夏天)及後續定製的“通用界面”硬件。
  2. **NanoCo (NanoClaw) 完成1200萬美元種子輪融資,拒絕約2000萬美元收購**——Cohen兄弟的安全專注、沙盒化OpenClaw替代品NanoClaw在開源項目啓動六週後,完成超額認購的1200萬美元種子輪,由Valley Capital Partners領投(Docker、Vercel、monday.com、Slow Ventures和Hugging Face的Clem Delangue參投),該項目曾通過Karpathy和新加坡外長走紅。
  3. **Andrej Karpathy加入Anthropic從事預訓練**——Karpathy加入Anthropic,組建團隊利用Claude加速預訓練研究,在特斯拉、OpenAI和Eureka Labs後重返前沿LLM研發。
  4. **Anthropic收購Stainless**——Anthropic收購了SDK生成初創公司Stainless,其工具為所有官方Anthropic SDK提供支持,也被OpenAI、Google、Replicate、Runway和Cloudflare使用;Anthropic將關閉所有託管的Stainless產品,將SDK工具獨佔(交易條款未披露;The Information此前估價超過3億美元)。
  5. **Ocean以2800萬美元融資走出隱身模式,專注代理郵件安全**——以色列創始人Shay Shwartz和Oran Moyal以2800萬美元總融資推出Ocean,由Lightspeed領投(Picture、Cerca及天使投資人Assaf Rappaport、Yevgeny Dibrov、Nadir Izrael參投),其多代理郵件調查平台針對AI生成釣魚攻擊。
  6. **Manus考慮10億美元融資以解除Meta收購**——Manus的三位中國聯合創始人(肖弘、季逸超、張濤)正在探索從外部投資者處籌集約10億美元,估值與Meta支付的超過20億美元相匹配,可能使用個人資本,以遵守北京方面解除十二月交易的要求——中國合資架構和香港IPO可能是下一步。
  7. **SpaceX公開提交納斯達克IPO申請,代碼SPCX**——SpaceX於5月20日公開提交S-1文件,將是史上最大IPO(目標募集約750億美元,估值約1.75萬億美元),在納斯達克上市,代碼SPCX,採用超級投票權結構以確保馬斯克的控制權,儘管存在數十億美元虧損和413億美元累計赤字。
  8. **OpenAI準備在幾天或幾周內提交IPO文件**——據WSJ和Bloomberg報道,OpenAI正與高盛和摩根士丹利合作秘密起草S-1,可能最快本週五提交,目標9月公開上市,估值超過8500億美元——在馬斯克訴訟因訴訟時效被駁回後快速推進。
  9. **Exa完成2.5億美元C輪融資,估值22億美元**——Exa Labs完成由Andreessen Horowitz領投的2.5億美元C輪,估值22億美元(較去年秋天的7億美元估值增長兩倍多),用於擴展其代理優化網絡搜索API、訓練下一代檢索模型,並處理其5000億+URL索引中每秒數十萬次搜索。