[AINews] Cognition融資10億美元,D輪估值260億
Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。
文章情報
要點
- Cognition完成10億美元D輪融資,估值260億美元,ARR預計年底超10億美元。
- 推理優化轉向架構層面:EAGLE 3.1、DeepSeek V4-Pro混合注意力、小米MiMo緩存管理等。
- 智能體工程聚焦模型-工具-記憶匹配:LangChain Deep Agents v0.6、Trajectory持續學習平台等。
- 新基準測試DeepSWE、ITBench-AA等反映真實工作流,模型在長尾任務上仍有挑戰。
為甚麼重要
這條新聞值得關注,因為Cognition完成10億美元D輪融資,估值260億美元,ARR預計年底超10億美元。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
Cognition公司在最新一輪D輪融資中籌集了10億美元,估值達到260億美元,這是該公司自去年9月C輪融資(估值100億美元)以來的又一次大幅增長。目前,Cognition已成為AI領域最大的獨立智能體實驗室,其年度經常性收入(ARR)預計將在年底前超過10億美元,顯示出強勁的增長勢頭。
在推理效率方面,趨勢正從內核級優化轉向架構級改進。EAGLE 3.1通過穩定隱藏狀態反饋和減少注意力漂移,提升了推測解碼的魯棒性,特別強調長上下文接受長度和實際服務可靠性。DeepSeek V4-Pro採用壓縮稀疏注意力和重度壓縮注意力,將100萬token的KV緩存降至V3.2的約10%,單token推理FLOPs降至27%,同時保持1.6萬億總參數中激活490億參數。小米的MiMo通過滑動窗口注意力加分層緩存管理,實現了5倍緩存容量和約80%的緩存成本降低。這些進展表明,長上下文推理的經濟性正由注意力設計、緩存層次和路由共同推動。
智能體工程領域,重點從模型質量轉向模型-工具-記憶的匹配。LangChain發佈了Deep Agents v0.6,引入Delta Channels,將200輪編碼會話的檢查點存儲從5.3GB降至129MB,並推出了計算機使用功能和Context Hub。Trajectory平台利用產品使用信號和智能體軌跡進行持續後訓練,獲得1500萬美元融資。開源社區也出現了基於LangChain/LangGraph的記憶中心智能體,以及RLM的最小訓練工具鏈,使得小團隊可在8塊A100上一天內完成長上下文智能體的強化學習調優。
新基準測試更加關注長期、複雜的真實工作流。DeepSWE包含113個任務,覆蓋91個倉庫和5種語言,平均比SWE-Bench Pro需要多5.5倍的代碼和7個文件。ITBench-AA評估了Kubernetes事件響應能力,所有前沿模型得分低於50%,Claude Opus 4.7以47%領先。AgingBench則將智能體部署後的性能退化視為生命週期問題,由壓縮、干擾和記憶更新引起。
模型發佈方面,ESMFold2用於蛋白質結構預測,涵蓋68億蛋白質和11億預測結構,並展示了治療性設計成果。Google DeepMind發佈了Gemini Embedding 2多模態嵌入模型。NVIDIA的LocateAnything實現高速目標檢測。Surya OCR 2以83.3%的OLMOCR準確率和5頁/秒的速度運行。LiteParse v2用Rust重寫,速度提升百倍,可邊緣部署。
編碼代理正在產品化並整合企業控制。OpenAI在Codex中淘汰舊模型,推出私有MCP連接、工作負載身份聯合和擴展的管理API。Cognition的客户數量增長超過10倍,Run-rate收入4.92億美元。Claude Code更新了可靠性和響應速度。GitHub推動代理化IDE。Cloudflare的代理平台因“分數計算”經濟性受到好評。
AI Reddit方面,熱門討論包括PrismML發佈的Binary/Ternary Bonsai Image 4B模型,可在WebGPU瀏覽器中本地運行,但被質疑為FLUX.2 Klein 4B的量化版本且缺乏充分署名。整體來看,AI領域在融資、技術架構、應用場景和標準化方面都有顯著進展。