2026-06-21 02:19 UTC+8站内改写2 分钟阅读更新: 2026-06-22 07:31 UTC+8

我看不到任何好的AI代理编排系统

作者观察到尽管有很多AI代理编排的尝试，但实际工作中人们仍在使用原始的拆分终端方式。现有方案缺乏环境隔离、细粒度控制和可审查性，导致要么完全信任AI黑箱，要么过度保守。作者认为理想的方案是允许委托任务给代理，同时能随时介入代码审查和修改。

最近，我在办公室里看到一位同事同时开启了六个Claude Code实例，每个都在不同的窗口中运行。这一幕让我深思：尽管我们看到了大量关于AI代理编排的尝试，甚至有一些病毒式传播的仓库展示了类似电子游戏角色般众多的代理，你可以点击任何一个并与之对话，但这些解决方案实际上并不实用——它们只是表面功夫。到头来，人们还是会回到拆分终端的老路上。

环境问题是一个核心痛点。我不愿意在存有所有数据的机器上运行 claude --dangerously-skip-permissions 这样的命令。我希望每个代理都能在独立的Docker容器中运行。我知道有很多Claude Code的镜像，甚至有一些库可以触发任务，但我没看到任何被广泛采用的方案。

我感觉很多人在谈论代理工作流和同时运行大量代理，但实际上真正并行运行代理做实际工作的人，用的却是最原始的方式：只是几个终端窗口。这带来了很多问题：工作区怎么管理？我可以为每个代理设置工作树，但当我想要审查它们的成果时又该怎么办？

目前许多解决方案的一个主要问题是，它们假设一切都会顺利运行。缺乏一种简便的方式来控制代理并随时介入。Opus 4.8 很棒，但有时候直接查看代码并修改一个变量要容易得多（也便宜得多）。

现在科技界似乎存在两大阵营：

将代码视为黑箱，从不接触或查看代码，无论发生什么。
使用AI，但采取非常保守的方式：运行少数几个代理，同时监视它们，查看代码。他们并不真正信任AI。

第一类人在遇到难题时损失惨重，但第二类人却落后于第一类人。是的，我确实认为盲目地让AI处理事情会导致非常脆弱的架构，几个月后就会变成一堆无法维护的混乱。但公司或客户会根据你的工作成果来评判你，他们会看重你做了多少，而不是你避免了什么问题。所以，无论好坏，第二类人正在落后，并被视为“没有效率”。

胜利之道似乎是：将工作委托给代理，同时愿意亲自阅读代码并“弄脏双手”。

但我没看到任何库支持这种模式——即委托控制权，同时允许你随时介入检查发生了什么。

我尝试过Zed编辑器，它很不错，但仍然有“代码优先”的思路，也不支持VS Code插件。我认为，气氛编码者（vibe coders）逐渐明白了“你不需要懂编程”就能构建东西，但在关键时刻介入是最好的选择，而他们为此付出了沉重的代价。

代码仍然相关，但不必每时每刻都密切监视。如果你设计得当，并且AI理解你，它很可能会写出好的代码。就连Linus也承认AI已经达到了相当不错的水平。

我认为代码正开始变得次要。这开启了一种可能性，目前似乎只有Cursor和Replit在探索：在智能手机上开始编码。但那是另一个话题了。

关键在于，目前没有解决方案能让代码成为重要但非主要的角色。现有的解决方案或库将代理视为工作区的一部分，而不是反过来——而后者似乎才是更合理的方式。