2026-05-22 13:50 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI基礎設施新獨角獸：Exa、Modal、TurboPuffer融資動態

本週AI新聞相對平靜，但基礎設施領域迎來重大融資：TurboPuffer實現1億美元ARR且盈利；Exa以22億美元估值融資2.5億美元；Modal以47億美元估值融資3.55億美元。其他亮點包括RAEv2表示學習框架、Gated DeltaNet-2注意力機制、以及Codex和Gemini的智慧體工具更新。

來源Latent Space作者: Latent.Space

本週AI新聞雖然相對平靜，但基礎設施領域卻迎來了重大融資動態。多家AI基礎設施公司宣佈了新一輪融資，彰顯了市場對底層平臺的高度關注。

TurboPuffer實現了1億美元的年經常性收入（ARR）且已盈利，這距離其達到100萬美元ARR僅過去了19個月。該公司僅融資不到100萬美元，其成功表明，在AI領域，“無聊”的基礎設施同樣能創造巨大價值。Exa以22億美元估值完成了2.5億美元的C輪融資，Modal則以47億美元估值完成了3.55億美元的C輪融資。這些融資案例表明，投資者對AI基礎設施平臺的信心依然強勁。

在模型和研究方面，RAEv2作為表示自編碼器的後續版本，在視覺理解和生成任務上取得了顯著進展。研究表明，對最後K個編碼器層進行求和而不是僅使用最後一層，可以在不增加推理成本的情況下提升重建和生成質量。此外，NVIDIA的Gated DeltaNet-2透過通道門控機制解耦了線性注意力中的擦除和寫入操作，在語言建模和常識推理任務上優於KDA和Mamba-3，尤其在長上下文檢索方面表現突出。

智慧體工具和開發平臺方面，OpenAI的Codex推出了Appshots功能，可以捕獲Mac應用視窗的截圖和文本，為開發提供更豐富的上下文。Codex還支援遠端電腦使用，即使使用者的Mac處於鎖定狀態，也能透過手機安全地操作應用。Google的Gemini也展示了強大的智慧體能力，Gemini 3.5 Flash在APEX-Agents-AA排行榜上位列第一，並可透過單一API呼叫構建GitHub問題分類代理。

基礎設施領域還出現了更多創新。Weaviate在其資料庫中內建了MCP伺服器，使得編碼代理能夠無需額外程序即可檢索倉庫內容。LangChain推出了沙箱認證代理和安全邊界控制工具，以及新的型別化流協議，用於渲染工具、子代理、媒體和中斷。vLLM的彈性專家並行技術允許在不重啟的情況下動態調整MoE的DP/EP拓撲，這對於未來的容錯服務至關重要。

計算仍然是戰略瓶頸，市場呈現分層格局。美國領導者如OpenAI、Anthropic和Google處於多吉瓦級別；中國巨頭從數百兆瓦向多吉瓦擴充套件；歐洲競爭者如Mistral目前約90兆瓦，目標是到2029年達到1吉瓦。元件經濟學也在變化，HBM在AI晶片元件支出中的佔比從2024年第一季度的52%上升到2025年第四季度的63%。

多模態、影片、生物學和機器人領域也傳來新進展。Runway釋出了Aleph 2.0和Edit Studio，允許使用者編輯一幀並將編輯傳播到整個影片。Hugging Face的Carbon DNA模型系列在DNA序列設計和變異效應預測方面展示了應用潛力。在機器人領域，Hugging Face的LeRobot人形機器人專案提供了完整的開源硬體和軟體堆疊，成本約2500美元，強調可修復性和迭代速度。

總的來說，本週新聞突顯了AI基礎設施的強勁勢頭，以及從模型研究到開發工具、從計算資源到應用層面的廣泛創新。