2026-05-28 15:26 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

[AINews] Cognition融資10億美元，D輪估值260億

Cognition在D輪融資中籌集10億美元，估值達260億美元，年經常性收入（ARR）預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。

Cognition公司在最新一輪D輪融資中籌集了10億美元，估值達到260億美元，這是該公司自去年9月C輪融資（估值100億美元）以來的又一次大幅增長。目前，Cognition已成為AI領域最大的獨立智能體實驗室，其年度經常性收入（ARR）預計將在年底前超過10億美元，顯示出強勁的增長勢頭。

在推理效率方面，趨勢正從內核級優化轉向架構級改進。EAGLE 3.1通過穩定隱藏狀態反饋和減少注意力漂移，提升了推測解碼的魯棒性，特別強調長上下文接受長度和實際服務可靠性。DeepSeek V4-Pro採用壓縮稀疏注意力和重度壓縮注意力，將100萬token的KV緩存降至V3.2的約10%，單token推理FLOPs降至27%，同時保持1.6萬億總參數中激活490億參數。小米的MiMo通過滑動窗口注意力加分層緩存管理，實現了5倍緩存容量和約80%的緩存成本降低。這些進展表明，長上下文推理的經濟性正由注意力設計、緩存層次和路由共同推動。

智能體工程領域，重點從模型質量轉向模型-工具-記憶的匹配。LangChain發佈了Deep Agents v0.6，引入Delta Channels，將200輪編碼會話的檢查點存儲從5.3GB降至129MB，並推出了計算機使用功能和Context Hub。Trajectory平台利用產品使用信號和智能體軌跡進行持續後訓練，獲得1500萬美元融資。開源社區也出現了基於LangChain/LangGraph的記憶中心智能體，以及RLM的最小訓練工具鏈，使得小團隊可在8塊A100上一天內完成長上下文智能體的強化學習調優。

新基準測試更加關注長期、複雜的真實工作流。DeepSWE包含113個任務，覆蓋91個倉庫和5種語言，平均比SWE-Bench Pro需要多5.5倍的代碼和7個文件。ITBench-AA評估了Kubernetes事件響應能力，所有前沿模型得分低於50%，Claude Opus 4.7以47%領先。AgingBench則將智能體部署後的性能退化視為生命週期問題，由壓縮、干擾和記憶更新引起。

模型發佈方面，ESMFold2用於蛋白質結構預測，涵蓋68億蛋白質和11億預測結構，並展示了治療性設計成果。Google DeepMind發佈了Gemini Embedding 2多模態嵌入模型。NVIDIA的LocateAnything實現高速目標檢測。Surya OCR 2以83.3%的OLMOCR準確率和5頁/秒的速度運行。LiteParse v2用Rust重寫，速度提升百倍，可邊緣部署。

編碼代理正在產品化並整合企業控制。OpenAI在Codex中淘汰舊模型，推出私有MCP連接、工作負載身份聯合和擴展的管理API。Cognition的客户數量增長超過10倍，Run-rate收入4.92億美元。Claude Code更新了可靠性和響應速度。GitHub推動代理化IDE。Cloudflare的代理平台因“分數計算”經濟性受到好評。

AI Reddit方面，熱門討論包括PrismML發佈的Binary/Ternary Bonsai Image 4B模型，可在WebGPU瀏覽器中本地運行，但被質疑為FLUX.2 Klein 4B的量化版本且缺乏充分署名。整體來看，AI領域在融資、技術架構、應用場景和標準化方面都有顯著進展。