AI基礎設施新獨角獸:Exa、Modal、TurboPuffer融資動態
本週AI新聞相對平靜,但基礎設施領域迎來重大融資:TurboPuffer實現1億美元ARR且盈利;Exa以22億美元估值融資2.5億美元;Modal以47億美元估值融資3.55億美元。其他亮點包括RAEv2表示學習框架、Gated DeltaNet-2注意力機制、以及Codex和Gemini的智慧體工具更新。
文章情報
要點
- TurboPuffer達到1億美元ARR並實現盈利;Exa和Modal完成大規模融資。
- 新模型架構如RAEv2和Gated DeltaNet-2在收斂速度和長上下文檢索方面表現出色。
- 智慧體設計模式轉向子代理編排;Codex新增遠端電腦使用和Appshots功能。
- 計算仍然是最關鍵的戰略瓶頸,市場分層明顯;Hark融資7億美元。
為什麼重要
這條新聞值得關注,因為TurboPuffer達到1億美元ARR並實現盈利;Exa和Modal完成大規模融資。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
本週AI新聞雖然相對平靜,但基礎設施領域卻迎來了重大融資動態。多家AI基礎設施公司宣佈了新一輪融資,彰顯了市場對底層平臺的高度關注。
TurboPuffer實現了1億美元的年經常性收入(ARR)且已盈利,這距離其達到100萬美元ARR僅過去了19個月。該公司僅融資不到100萬美元,其成功表明,在AI領域,“無聊”的基礎設施同樣能創造巨大價值。Exa以22億美元估值完成了2.5億美元的C輪融資,Modal則以47億美元估值完成了3.55億美元的C輪融資。這些融資案例表明,投資者對AI基礎設施平臺的信心依然強勁。
在模型和研究方面,RAEv2作為表示自編碼器的後續版本,在視覺理解和生成任務上取得了顯著進展。研究表明,對最後K個編碼器層進行求和而不是僅使用最後一層,可以在不增加推理成本的情況下提升重建和生成質量。此外,NVIDIA的Gated DeltaNet-2透過通道門控機制解耦了線性注意力中的擦除和寫入操作,在語言建模和常識推理任務上優於KDA和Mamba-3,尤其在長上下文檢索方面表現突出。
智慧體工具和開發平臺方面,OpenAI的Codex推出了Appshots功能,可以捕獲Mac應用視窗的截圖和文本,為開發提供更豐富的上下文。Codex還支援遠端電腦使用,即使使用者的Mac處於鎖定狀態,也能透過手機安全地操作應用。Google的Gemini也展示了強大的智慧體能力,Gemini 3.5 Flash在APEX-Agents-AA排行榜上位列第一,並可透過單一API呼叫構建GitHub問題分類代理。
基礎設施領域還出現了更多創新。Weaviate在其資料庫中內建了MCP伺服器,使得編碼代理能夠無需額外程序即可檢索倉庫內容。LangChain推出了沙箱認證代理和安全邊界控制工具,以及新的型別化流協議,用於渲染工具、子代理、媒體和中斷。vLLM的彈性專家並行技術允許在不重啟的情況下動態調整MoE的DP/EP拓撲,這對於未來的容錯服務至關重要。
計算仍然是戰略瓶頸,市場呈現分層格局。美國領導者如OpenAI、Anthropic和Google處於多吉瓦級別;中國巨頭從數百兆瓦向多吉瓦擴充套件;歐洲競爭者如Mistral目前約90兆瓦,目標是到2029年達到1吉瓦。元件經濟學也在變化,HBM在AI晶片元件支出中的佔比從2024年第一季度的52%上升到2025年第四季度的63%。
多模態、影片、生物學和機器人領域也傳來新進展。Runway釋出了Aleph 2.0和Edit Studio,允許使用者編輯一幀並將編輯傳播到整個影片。Hugging Face的Carbon DNA模型系列在DNA序列設計和變異效應預測方面展示了應用潛力。在機器人領域,Hugging Face的LeRobot人形機器人專案提供了完整的開源硬體和軟體堆疊,成本約2500美元,強調可修復性和迭代速度。
總的來說,本週新聞突顯了AI基礎設施的強勁勢頭,以及從模型研究到開發工具、從計算資源到應用層面的廣泛創新。