2026-06-14站内改写2 分鐘閱讀更新: 2026-06-14

為什麼AI代理無法擴充套件：這是一個工程問題，而非AI問題

文章指出，擴充套件AI代理面臨五大基礎設施挑戰：使用者行為不可預測、企業資料（90%以上為非結構化）難以訪問、多代理協調、企業特定知識融入以及可觀測性缺失。解決方案包括確定性防護欄、非結構化資料管道、代理間驗證和決策質量監控。核心觀點：LLM是簡單的部分，圍繞它的工程系統才是瓶頸。

來源Hacker News AI作者: dovelome

AI代理的擴充套件問題並非源於大語言模型（LLM）的能力不足，而是一個系統工程挑戰。當代理從演示階段進入真實使用者環境時，基礎設施的複雜性迅速凸顯。

首先，使用者行為的不可預測性是第一大障礙。當LLM直接面向消費者時，使用者可能做出各種意想不到的操作，因此需要一層規劃器來約束LLM的執行路徑。當前許多工具如Claude Code、Cursor和Windsurf都採用了這種“計劃-執行”模式：代理提出一個計劃，然後在該計劃內執行，而不是自由發揮。這種確定性防護欄能夠有效防止使用者“瘋狂行為”導致的失敗。

其次，資料可訪問性是真正的瓶頸。超過90%的企業資料是非結構化的，包括合同、PDF、電子郵件和轉錄檔案。目前的生成式AI專案僅利用了不到1%的企業資料。代理即使推理能力再強，如果無法訪問所需資料，也只能給出基於“感覺”的錯誤答案。因此，構建一個高效的非結構化資料管道——包括資料分塊、嵌入、治理和服務——是必須優先解決的問題。這是資料工程問題，而非模型問題。

第三，多代理協調帶來了錯誤傳播的挑戰。當五個代理串聯工作時，即使每個代理的失敗率僅為5%，整體可靠性也會降至約77%。若代理B產生幻覺，其錯誤將沿著鏈條傳播並放大。解決方案包括在每個代理跳轉之間新增確定性驗證、設定回退路徑，並建立一個代理登錄檔以便發現和排程合適的代理。

第四，企業特定知識的融入是另一個關鍵挑戰。LLM在第一天對你的業務一無所知。微調成本高昂且速度慢，RAG雖然成本較低，但依賴於穩健的資料管道。大多數公司在這一步停滯不前——代理在公共知識上表現良好，但在內部流程上失敗。

最後，監控方面存在巨大缺口。傳統APM工具（如Datadog、Grafana）僅監控延遲和錯誤，而代理監控需要跟蹤決策質量：代理是否選擇了正確的工具？計劃是否合理？輸出是否事實正確？目前這一可觀測性層幾乎沒有現成工具支援。

為了應對這些挑戰，文章提出了一個包含規劃器/路由器、驗證器、聚合器以及可觀測性迴圈的架構。規劃器將使用者請求分解為子任務並選擇專業代理；每個代理後接驗證器進行確定性檢查；聚合器合併結果並檢測矛盾；可觀測性迴圈提供決策審計和質量評分。

最終，團隊需要將AI代理視為分散式系統問題，而非單純的AI問題。確定性系統應包裹非確定性模型，而非相反。LLM提出方案，確定性程式碼決定執行。只有這樣，代理才能從原型走向規模化生產。