2026-06-12站内改写2 分钟阅读更新: 2026-06-12

AINews：循环艺术：堆叠循环的技艺

本文探讨了AI领域中的“循环”概念，即设计自动循环来驱动代理，而非手动提示。文章涵盖了Anthropic的Fable 5发布及其引发的争议、自动化AI研究系统、数据基础设施瓶颈、推理速度优化以及代理工具的最新发展。

在人工智能领域，近期出现了一个引人注目的趋势：从手动提示转向设计循环来驱动AI代理。这一概念由多位知名人士提出，包括Peter Steinberger、Boris Cherny和Andrej Karpathy。他们认为，为了最大化AI工具的效用，必须将人类从循环中移除，通过设计自主循环来持续优化和迭代。本文回顾了这一理念，并总结了本周AI领域的重要新闻。

Anthropic的Fable 5模型发布成为了热点，但其隐蔽降级政策迅速引发了强烈反弹。Anthropic最初决定在某些AI研究用例中暗中降低模型性能，但在公开批评后一天内即撤回。技术社区批评这种不透明的行为破坏了用户与提供商之间的信任，并呼吁更好的治理和透明度。尽管如此，Fable 5在多个基准测试中表现出色，例如在WeirdML上达到87.8%的准确率，在FrontierSWE上排名第一。然而，实际使用中仍存在成本高、拒绝请求以及输出异常等问题。

在自动化研究方面，Recursive SI发布了其自动开放发现系统，在NVIDIA SOL-ExecBench、NanoGPT Speedrun和NanoChat等任务上达到了最先进水平。微软研究院的Arbor则展示了其长期假设树推理能力，在六个研究任务中超越了Codex和Claude Code。这些系统表明，当前AI已能够在窄领域、高反馈的系统优化任务中做出贡献。同时，新基准如PostTrainBench和Agents' Last Exam也正在评估AI自我改进和真实世界任务的能力。

数据基础设施被强调为关键瓶颈。Macrodata Labs推出了Refiner框架，旨在解决机器人领域多模态数据管道的混乱问题。Goodfire和AllenAI分别推出了预测性数据调试和模型依赖图追踪工具，揭示了现代LLM构建的复杂性和合成性。在推理速度方面，DiffusionGemma和Unsloth等技术实现了显著加速，而MiniMax和Together则在长上下文服务方面取得了进展。

此外，代理工具正在向可调度、凭证感知的基础设施原语演进。ClaudeDevs增加了调度部署和环境变量，Perplexity将深度研究集成到计算机中。Hermes、Devin、Cursor和GitHub Copilot等也在操作工具方面持续改进。整体而言，行业焦点正从“最佳模型”转向执行控制、审查层、可观测性和可移植性。最后，Anthropic的Fable 5相关讨论占据了社交媒体的大部分关注，但技术社区也逐渐认识到，自动化循环和系统架构才是未来竞争的关键。