AI News HubLIVE
站內改寫2 分鐘閱讀

我看不到任何好的AI代理編排系統

作者觀察到儘管有很多AI代理編排的嘗試,但實際工作中人們仍在使用原始的拆分終端方式。現有方案缺乏環境隔離、細粒度控制和可審查性,導致要麼完全信任AI黑箱,要麼過度保守。作者認為理想的方案是允許委託任務給代理,同時能隨時介入程式碼審查和修改。

來源Hacker News AI作者: ffacu

最近,我在辦公室裡看到一位同事同時開啟了六個Claude Code例項,每個都在不同的視窗中執行。這一幕讓我深思:儘管我們看到了大量關於AI代理編排的嘗試,甚至有一些病毒式傳播的倉庫展示了類似電子遊戲角色般眾多的代理,你可以點選任何一個並與之對話,但這些解決方案實際上並不實用——它們只是表面功夫。到頭來,人們還是會回到拆分終端的老路上。

環境問題是一個核心痛點。我不願意在存有所有資料的機器上執行 claude --dangerously-skip-permissions 這樣的命令。我希望每個代理都能在獨立的Docker容器中執行。我知道有很多Claude Code的映象,甚至有一些庫可以觸發任務,但我沒看到任何被廣泛採用的方案。

我感覺很多人在談論代理工作流和同時執行大量代理,但實際上真正並行執行代理做實際工作的人,用的卻是最原始的方式:只是幾個終端視窗。這帶來了很多問題:工作區怎麼管理?我可以為每個代理設定工作樹,但當我想要審查它們的成果時又該怎麼辦?

目前許多解決方案的一個主要問題是,它們假設一切都會順利執行。缺乏一種簡便的方式來控制代理並隨時介入。Opus 4.8 很棒,但有時候直接檢視程式碼並修改一個變數要容易得多(也便宜得多)。

現在科技界似乎存在兩大陣營:

  • 將程式碼視為黑箱,從不接觸或檢視程式碼,無論發生什麼。
  • 使用AI,但採取非常保守的方式:執行少數幾個代理,同時監視它們,檢視程式碼。他們並不真正信任AI。

第一類人在遇到難題時損失慘重,但第二類人卻落後於第一類人。是的,我確實認為盲目地讓AI處理事情會導致非常脆弱的架構,幾個月後就會變成一堆無法維護的混亂。但公司或客戶會根據你的工作成果來評判你,他們會看重你做了多少,而不是你避免了什麼問題。所以,無論好壞,第二類人正在落後,並被視為“沒有效率”。

勝利之道似乎是:將工作委託給代理,同時願意親自閱讀程式碼並“弄髒雙手”。

但我沒看到任何庫支援這種模式——即委託控制權,同時允許你隨時介入檢查發生了什麼。

我嘗試過Zed編輯器,它很不錯,但仍然有“程式碼優先”的思路,也不支援VS Code外掛。我認為,氣氛編碼者(vibe coders)逐漸明白了“你不需要懂程式設計”就能構建東西,但在關鍵時刻介入是最好的選擇,而他們為此付出了沉重的代價。

程式碼仍然相關,但不必每時每刻都密切監視。如果你設計得當,並且AI理解你,它很可能會寫出好的程式碼。就連Linus也承認AI已經達到了相當不錯的水平。

我認為程式碼正開始變得次要。這開啟了一種可能性,目前似乎只有Cursor和Replit在探索:在智慧手機上開始編碼。但那是另一個話題了。

關鍵在於,目前沒有解決方案能讓程式碼成為重要但非主要的角色。現有的解決方案或庫將代理視為工作區的一部分,而不是反過來——而後者似乎才是更合理的方式。