序列雷達 #861:上週AI要聞——IPO、互動式模型與遞迴之夢
上週AI領域迎來多個重要事件:Cerebras IPO使其市值飆升至950億美元;Thinking Machines推出將互動能力內建於模型本身的“互動式模型”;前Salesforce首席科學家Richard Socher創立Recursive Superintelligence,致力於透過自動實驗實現AI自我改進;前阿里巴巴Qwen負責人林俊陽以約20億美元估值創辦新AI實驗室。
上週在AI領域,幾件大事的發生似乎更像是一場哲學挑釁,而非單純的產品釋出。無論是IPO、演示還是實驗室公告,其共同線索並非更大的模型或更寬的上下文視窗,而是關於“主體性”:誰來塑造智慧?誰來改進它?當工具開始改進工具時會發生什麼?
首先是Cerebras。其IPO不僅是AI晶片公司的融資里程碑,更提醒我們AI競賽依然高度依賴物理基礎設施——矽片、電力、網路、冷卻、資本市場和地緣政治焦慮。Cerebras一直扮演著AI硬體領域的異類角色:它沒有選擇適度擴大晶片尺寸,而是全力投入晶圓級計算機,其核心理念是“如果晶片本身就是資料中心呢?”這聽起來像是半導體會議上的隨想,卻揭示了一個重要真理:如果智慧正成為商品,那麼算力就是煉油廠。如今公開市場正在投票決定哪些煉油廠更為重要。
隨後Thinking Machines推出了“互動式模型”,帶來了一種截然不同的氛圍。當業界大多在慶祝那些能消失在雲端並帶回電子表格的自主智慧體時,Thinking Machines卻押注於相反的方向:始終在場的AI。不是“提出提示,等待,接收”,而是持續的、多模態的協作。模型能傾聽、觀察、打斷、讓步並即時回應。換言之,它不再將互動視為附著於智慧之上的UI層,而是將其作為智慧本身的一部分。這是一個微妙而深刻的觀點。人類認知在計算之前首先是社會性的。我們透過手勢、停頓、糾正、共享語境和尷尬的沉默來思考。讓AI更有用,可能需要讓它更像一個非常快速且專注的協作者,而不是一個預言家。
最智識上令人興奮的發展來自新的“AI科學家”運動。Recursive以雄心壯志登場,旨在構建透過自動實驗自我改進的系統。Adaption的AutoScientist也指向了類似方向,自動化訓練、對齊和模型適應迴圈。這一夢想令人陶醉:研究不再是線性的個人過程,而成為假設、實驗、評估和改進的複合機器。
然而,這個夢想也值得警惕。遞迴自我改進一直遊走在電腦科學、科幻小說和存在風險研討會之間。將其轉化為風險投資支援的產品類別既令人振奮,又略顯瘋狂——坦白說,許多重要技術都如此起步。問題不在於AI能否幫助研究——它已經在做了。問題在於,我們能否構建出在提升能力的同時不侵蝕基礎、安全性、多樣性和人類判斷的系統。
另一個訊號來自中國。阿里巴巴Qwen模型的前首席研究員林俊陽正在洽談以約20億美元估值籌集數億美元,成立新AI實驗室。這個估值對於一家全新實驗室而言幾乎有些無禮——尤其是在中國,AI初創公司的估值通常比美國更為保守——但林俊陽擁有前沿AI領域罕見的資歷:他已幫助將一個模型系列發展為生態系統。他的離職也揭示了中國AI內部一種微妙的張力:當阿里巴巴將更多精力轉向專有模型和變現時,開源人才可能準備獨立組建實驗室。但這不是簡單的“籌錢、買GPU、訓練模型、重複”故事。新的中國AI實驗室必須應對美國晶片出口管制、受限的算力訪問,以及如何構建不與阿里巴巴、字節跳動等巨頭重疊的研究議程等棘手問題。從這個意義上說,林俊陽的新實驗室不只是又一個創始人的光環故事,而是檢驗中國開源模型勢頭能否轉化為風險投資規模的公司。
機器不再只是回答問題。它在傾聽、適應、實驗——並且,也許開始詢問它應該成為什麼。
在AI研究方面,本週有多篇論文值得關注,包括用於評估多模態智慧體視覺記憶的MemEye框架、自進化記憶架構EVOLVEMEM、開源智慧體建模框架Orchard、時間序列預測的多智慧體框架NEXUS,以及高效的LLM內容稽核模型GLiGuard等。
技術釋出方面,Thinking Machines推出了“互動式模型”的研究預覽版,將互動能力內建於模型本身,而非透過外部工具實現。
此外,十條重要AI新聞包括:Cerebras IPO股價飆升68%,市值達950億美元;Recursive Superintelligence獲6.5億美元融資;OpenAI考慮起訴蘋果;思科裁員約4000人但營收創紀錄;Adaption釋出AutoScientist;馬斯克與奧特曼在法庭進行結案陳詞;xAI推出Grok Build;Nebius Q1營收增長684%;語音工具Wispr AI融資談判估值約20億美元;前阿里巴巴Qwen負責人林俊陽以約20億美元估值新設AI實驗室。