2026-05-20 04:27 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

我們如何構建 LangSmith Engine：用於改進代理的代理

LangSmith Engine 是一個位於代理追蹤之上的智慧代理，能夠發現重複出現的問題並提出改進建議。本文詳細介紹了其技術架構，包括如何大規模篩選追蹤、識別問題、生成評估器和資料集示例，並持續更新代理概覽以最佳化後續執行。

上週，我們釋出了 LangSmith Engine，這是一個位於 LangSmith 追蹤專案之上的智慧代理，旨在自動發現並解決代理執行中的重複問題。Engine 的核心任務包括：識別追蹤中的失敗模式、將其轉化為可處理的問題、以及生成評估器、資料集示例和修復方案，從而將生產中的失敗轉化為團隊的長期資產。

為什麼構建 Engine

隨著部署的代理數量增長，生成的追蹤資料也急劇增加。基本的工具錯誤容易發現，但許多問題——如代理迴圈呼叫同一工具、使用錯誤引數、遺漏必要工具等——需要深入檢查每條追蹤才能察覺。為了解決這一內部痛點，我們開發了 Engine。

Engine 的輸出：問題（Issues）

每個問題包含名稱、描述、類別、嚴重等級、相關追蹤證據和建議行動。建議行動包括：線上評估器（可標記未來類似失敗）、資料集示例（用於離線迴歸測試）、以及程式碼或提示的修復建議。Engine 不僅指出錯誤，更致力於將失敗轉化為可測試、可行動的改進點。

Engine 的輸入

Engine 接收四種主要輸入：

指令：透過“代理概覽”（Agent Overview）描述代理的行為、預期追蹤結構和已知失敗模式。首次執行時從引導答案和專案上下文建立，後續手動或自動更新。
追蹤：透過 LangSmith CLI 拉取，優先使用壓縮的軌跡摘要進行篩選，僅在需要時載入完整內容。
現有問題：讀取當前問題看板，避免重複，追加證據。
程式碼庫（可選）：連線 GitHub 倉庫後，Engine 能更精確診斷問題並自動提出程式碼修改。

高層架構

Engine 基於 Deep Agents 構建，執行在沙盒環境中，透過 LangSmith CLI 與 LangSmith 互動。其處理流程分為五個步驟：

準備上下文：設定沙盒、初始化代理概覽、配置 CLI。
大規模篩選：使用專用的篩選子代理（基於 Haiku 模型）並行處理約 20 條追蹤的壓縮軌跡，快速標記可疑項。
深入調查：主代理排程調查子代理，載入完整追蹤內容，尋找失敗模式。
建立問題與資產：生成問題、評估器、資料集示例，並可選地自動提交修復。
更新記憶：將新發現寫入代理概覽，供後續執行參考。

篩選階段是 Engine 擴充套件性的關鍵。透過軌跡格式（每輪角色、延遲、內容大小）和優先處理帶有反饋的追蹤，Engine 有效降低了需要詳細分析的追蹤數量。實踐證明，這種兩階段方法使 Engine 能夠處理數千條生產追蹤而不會過載。

未來展望

Engine 目前仍處於早期階段，但已顯著提升了代理除錯和迭代的效率。未來，我們計劃增強其對複雜多步驟問題的識別能力，並進一步最佳化程式碼庫的整合體驗。