2026-05-28 15:26 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

[AINews] Cognition融资10亿美元，D轮估值260亿

Cognition在D轮融资中筹集10亿美元，估值达260亿美元，年经常性收入（ARR）预计年底突破10亿美元。文章还涵盖了推理效率优化、智能体工程、持续学习、新基准测试、模型发布以及编码代理产品化等AI领域的最新进展。

Cognition公司在最新一轮D轮融资中筹集了10亿美元，估值达到260亿美元，这是该公司自去年9月C轮融资（估值100亿美元）以来的又一次大幅增长。目前，Cognition已成为AI领域最大的独立智能体实验室，其年度经常性收入（ARR）预计将在年底前超过10亿美元，显示出强劲的增长势头。

在推理效率方面，趋势正从内核级优化转向架构级改进。EAGLE 3.1通过稳定隐藏状态反馈和减少注意力漂移，提升了推测解码的鲁棒性，特别强调长上下文接受长度和实际服务可靠性。DeepSeek V4-Pro采用压缩稀疏注意力和重度压缩注意力，将100万token的KV缓存降至V3.2的约10%，单token推理FLOPs降至27%，同时保持1.6万亿总参数中激活490亿参数。小米的MiMo通过滑动窗口注意力加分层缓存管理，实现了5倍缓存容量和约80%的缓存成本降低。这些进展表明，长上下文推理的经济性正由注意力设计、缓存层次和路由共同推动。

智能体工程领域，重点从模型质量转向模型-工具-记忆的匹配。LangChain发布了Deep Agents v0.6，引入Delta Channels，将200轮编码会话的检查点存储从5.3GB降至129MB，并推出了计算机使用功能和Context Hub。Trajectory平台利用产品使用信号和智能体轨迹进行持续后训练，获得1500万美元融资。开源社区也出现了基于LangChain/LangGraph的记忆中心智能体，以及RLM的最小训练工具链，使得小团队可在8块A100上一天内完成长上下文智能体的强化学习调优。

新基准测试更加关注长期、复杂的真实工作流。DeepSWE包含113个任务，覆盖91个仓库和5种语言，平均比SWE-Bench Pro需要多5.5倍的代码和7个文件。ITBench-AA评估了Kubernetes事件响应能力，所有前沿模型得分低于50%，Claude Opus 4.7以47%领先。AgingBench则将智能体部署后的性能退化视为生命周期问题，由压缩、干扰和记忆更新引起。

模型发布方面，ESMFold2用于蛋白质结构预测，涵盖68亿蛋白质和11亿预测结构，并展示了治疗性设计成果。Google DeepMind发布了Gemini Embedding 2多模态嵌入模型。NVIDIA的LocateAnything实现高速目标检测。Surya OCR 2以83.3%的OLMOCR准确率和5页/秒的速度运行。LiteParse v2用Rust重写，速度提升百倍，可边缘部署。

编码代理正在产品化并整合企业控制。OpenAI在Codex中淘汰旧模型，推出私有MCP连接、工作负载身份联合和扩展的管理API。Cognition的客户数量增长超过10倍，Run-rate收入4.92亿美元。Claude Code更新了可靠性和响应速度。GitHub推动代理化IDE。Cloudflare的代理平台因“分数计算”经济性受到好评。

AI Reddit方面，热门讨论包括PrismML发布的Binary/Ternary Bonsai Image 4B模型，可在WebGPU浏览器中本地运行，但被质疑为FLUX.2 Klein 4B的量化版本且缺乏充分署名。整体来看，AI领域在融资、技术架构、应用场景和标准化方面都有显著进展。