AI News HubLIVE
站内改写

[AINews] Cognition融资10亿美元,D轮估值260亿

Cognition在D轮融资中筹集10亿美元,估值达260亿美元,年经常性收入(ARR)预计年底突破10亿美元。文章还涵盖了推理效率优化、智能体工程、持续学习、新基准测试、模型发布以及编码代理产品化等AI领域的最新进展。

文章情报

投资人进阶

要点

  • Cognition完成10亿美元D轮融资,估值260亿美元,ARR预计年底超10亿美元。
  • 推理优化转向架构层面:EAGLE 3.1、DeepSeek V4-Pro混合注意力、小米MiMo缓存管理等。
  • 智能体工程聚焦模型-工具-记忆匹配:LangChain Deep Agents v0.6、Trajectory持续学习平台等。
  • 新基准测试DeepSWE、ITBench-AA等反映真实工作流,模型在长尾任务上仍有挑战。

为什么重要

这条新闻值得关注,因为Cognition完成10亿美元D轮融资,估值260亿美元,ARR预计年底超10亿美元。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Cognition公司在最新一轮D轮融资中筹集了10亿美元,估值达到260亿美元,这是该公司自去年9月C轮融资(估值100亿美元)以来的又一次大幅增长。目前,Cognition已成为AI领域最大的独立智能体实验室,其年度经常性收入(ARR)预计将在年底前超过10亿美元,显示出强劲的增长势头。

在推理效率方面,趋势正从内核级优化转向架构级改进。EAGLE 3.1通过稳定隐藏状态反馈和减少注意力漂移,提升了推测解码的鲁棒性,特别强调长上下文接受长度和实际服务可靠性。DeepSeek V4-Pro采用压缩稀疏注意力和重度压缩注意力,将100万token的KV缓存降至V3.2的约10%,单token推理FLOPs降至27%,同时保持1.6万亿总参数中激活490亿参数。小米的MiMo通过滑动窗口注意力加分层缓存管理,实现了5倍缓存容量和约80%的缓存成本降低。这些进展表明,长上下文推理的经济性正由注意力设计、缓存层次和路由共同推动。

智能体工程领域,重点从模型质量转向模型-工具-记忆的匹配。LangChain发布了Deep Agents v0.6,引入Delta Channels,将200轮编码会话的检查点存储从5.3GB降至129MB,并推出了计算机使用功能和Context Hub。Trajectory平台利用产品使用信号和智能体轨迹进行持续后训练,获得1500万美元融资。开源社区也出现了基于LangChain/LangGraph的记忆中心智能体,以及RLM的最小训练工具链,使得小团队可在8块A100上一天内完成长上下文智能体的强化学习调优。

新基准测试更加关注长期、复杂的真实工作流。DeepSWE包含113个任务,覆盖91个仓库和5种语言,平均比SWE-Bench Pro需要多5.5倍的代码和7个文件。ITBench-AA评估了Kubernetes事件响应能力,所有前沿模型得分低于50%,Claude Opus 4.7以47%领先。AgingBench则将智能体部署后的性能退化视为生命周期问题,由压缩、干扰和记忆更新引起。

模型发布方面,ESMFold2用于蛋白质结构预测,涵盖68亿蛋白质和11亿预测结构,并展示了治疗性设计成果。Google DeepMind发布了Gemini Embedding 2多模态嵌入模型。NVIDIA的LocateAnything实现高速目标检测。Surya OCR 2以83.3%的OLMOCR准确率和5页/秒的速度运行。LiteParse v2用Rust重写,速度提升百倍,可边缘部署。

编码代理正在产品化并整合企业控制。OpenAI在Codex中淘汰旧模型,推出私有MCP连接、工作负载身份联合和扩展的管理API。Cognition的客户数量增长超过10倍,Run-rate收入4.92亿美元。Claude Code更新了可靠性和响应速度。GitHub推动代理化IDE。Cloudflare的代理平台因“分数计算”经济性受到好评。

AI Reddit方面,热门讨论包括PrismML发布的Binary/Ternary Bonsai Image 4B模型,可在WebGPU浏览器中本地运行,但被质疑为FLUX.2 Klein 4B的量化版本且缺乏充分署名。整体来看,AI领域在融资、技术架构、应用场景和标准化方面都有显著进展。