我們在 Interrupt 上釋出的所有產品
LangChain 在 Interrupt 2026 上釋出了一系列新產品和功能,旨在幫助團隊加速智慧體開發週期,包括自動除錯、託管基礎設施、可觀測性和治理等。
文章情報
要點
- LangSmith Engine 可自動監控生產環境中的追蹤資料,聚類故障並生成修復 PR。
- Managed Deep Agents 提供 API 優先的託管執行時,用於建立和執行深度智慧體。
- SmithDB 是專為智慧體可觀測性設計的資料庫,效能提升高達 15 倍。
- LangSmith LLM Gateway 在執行時強制實施支出限制並檢測敏感資料。
為什麼重要
這條新聞值得關注,因為LangSmith Engine 可自動監控生產環境中的追蹤資料,聚類故障並生成修復 PR。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
在今天的 Interrupt 大會上,我們宣佈了大量新產品和功能,旨在幫助團隊加速智慧體開發週期。有些產品負責處理需要團隊花費數月才能自行搭建的基礎設施,其他產品則幫助你更快地發現故障、理解原因並自動修復。以下是我們的釋出內容。
LangSmith Engine
到目前為止,改進智慧體仍然是一個手動過程:閱讀追蹤、尋找模式、編寫評估、建立修復。LangSmith Engine 是一個自主執行的智慧體,它可以為你自動執行這一迴圈。它會監控生產環境中的追蹤資料,將故障聚類為命名問題,針對程式碼診斷根本原因,並提出修復和評估覆蓋方案,以防止迴歸問題再次出現。你只需稽核併合並改進即可。
對於每個引擎發現的問題,它可以:
- 開啟一個包含針對性程式碼或提示修復的 PR。
- 建立一個自定義線上評估器,專門針對該問題,使重複出現的問題自動被重新發現。
- 將失敗的追蹤作為真實示例新增到你的離線評估套件中。
Engine 基於 LangSmith 現有的追蹤和評估基礎設施構建,因此可以輕鬆整合到團隊已有的工作流程中。Cogent 和 Campfire 已經使用它解決了影響數千條追蹤的問題。目前已公開測試。
SmithDB
SmithDB 是專為智慧體可觀測性而構建的資料庫,目前支援核心 LangSmith 工作負載。智慧體追蹤在體積和大小上呈爆炸式增長,包含深層巢狀的跨度、長時間執行的操作以及跨數小時分段到達的事件。分析這些追蹤所需的查詢模式(隨機訪問、互動式過濾、全文搜尋、JSON 過濾、樹感知查詢、執行緒重建、聚合)需要一種全新的架構。
SmithDB 基於 Rust 構建,底層使用 Apache DataFusion 和 Vortex,物件儲存用於持久化追蹤資料,小型 Postgres 元儲存,以及無狀態的訊息接收、查詢和壓縮服務。
效能:核心 LangSmith 體驗速度提升高達 15 倍,P50 追蹤樹載入時間為 92ms,P50 單次執行載入時間為 71ms。
可移植性:基於物件儲存且無狀態,因此可以透過增加計算資源來擴充套件,並且在自託管和多雲環境中比傳統資料庫叢集更容易執行。
智慧體原生查詢模式:專為長時間執行的跨度、每次執行的多個事件、大型負載、全文搜尋和亞秒級延遲下的 JSON 過濾而設計。
Managed Deep Agents
Managed Deep Agents 為開發者提供了一個 API 優先的託管執行時,用於在 LangSmith 中建立、執行和操作深度智慧體。它基於開源的 Deep Agents 框架構建,支援能夠規劃、使用工具、委託給子代理、寫入檔案以及跨更長時間線工作的智慧體,無需團隊自行搭建智慧體伺服器或為每個智慧體重建執行時基礎設施。
該產品專為需要持久執行、持久上下文、工具訪問、沙盒程式碼執行和生產環境可見性的智慧體而設計。開發者可以使用熟悉的 Deep Agents 專案結構定義智慧體,透過 /v1/deepagents API 以程式設計方式管理它們,並在 LangSmith 中檢查每次執行。
關鍵功能包括:
- 透過 API 建立、更新、管理和執行深度智慧體的託管執行時。
- 持久執行緒、流式執行、檢查點和用於長時間執行任務的人機協同工作流。
- 支援 AGENTS.md、skills/、subagents/ 和 tools.json 的智慧體上下文和檔案。
- Context Hub 用於跨執行保留和更新智慧體記憶、操作筆記、使用者偏好和專案上下文。
- 支援需要程式碼、shell 命令、檔案 I/O、資料分析或工件生成的智慧體的沙盒執行環境。
LangSmith Sandboxes 正式上市
LangSmith Sandboxes 是用於智慧體的安全程式碼執行環境。它們為智慧體提供帶有檔案系統、shell、包管理器、持久狀態和網路邊界的執行時,因此智慧體可以編寫程式碼、安裝依賴項、執行測試、檢查失敗並跨更長的會話繼續工作。
每個沙箱執行在硬體虛擬化的 microVM 中,與你的服務和其他沙箱隔離。這種隔離對於執行模型生成的程式碼、外部依賴項或使用者提供的指令碼的智慧體尤其重要。
沙箱透過團隊已經使用的相同 LangSmith SDK 和 API 金鑰工作,因此團隊可以輕鬆將安全程式碼執行新增到 Deep Agents、Open SWE、LangSmith Deployment、LangSmith Fleet 或自定義智慧體工作流中,而無需自行構建執行時層。
GA 版本的亮點:
- 快照和廉價分支:捕獲沙箱或從 Docker 映象構建,然後使用寫時複製從該狀態分叉並行沙箱。
- 藍圖:定義可重新整理的基礎環境,以便新沙箱從全新的依賴項、倉庫狀態和預熱快取開始。
- 空閒時暫停:空閒沙箱自動暫停,避免為未使用的資源付費。
- Sandbox CLI:管理沙箱、構建快照、開啟控制台、隧道 TCP 以及使用 ssh、scp、rsync 和 sftp 等工具。
- 帶有自定義回撥的 Auth Proxy:在網路層注入憑據,使秘密不進入執行時,支援自定義秘密解析、審計鉤子和域名允許/拒絕列表。
Context Hub
LangSmith Context Hub 為團隊提供了一箇中央位置來管理塑造智慧體行為的檔案,包括 AGENTS.md 檔案、技能、策略、示例和其他智慧體讀取和遵循的上下文包。
上下文通常與框架程式碼不同。它變化迅速,因為團隊不斷最佳化指令、更新示例、新增策略並學習有效的方法。它也是由組織中的不同人員(包括設計師、營銷人員、支援負責人、產品經理、合規團隊和其他主題專家)塑造的。Context Hub 將該工作流程引入 LangSmith,以便團隊無需將所有內容都透過 GitHub 即可協作處理智慧體上下文。
核心功能包括:
- 版本控制:跟蹤上下文檔案的更改,檢查以前的版本,並在需要時回滾。
- 標籤:使用 dev、staging 或 prod 等標籤標記版本,以便智慧體在正確的環境中使用正確的上下文。
- 評論:直接在上下文更改上與團隊成員協作。
透過 Context Hub,團隊可以將上下文視為智慧體系統的一等部分,並共享用於管理決定智慧體行為的指令、示例和策略的工作流程。
LangSmith LLM Gateway
LangSmith LLM Gateway 是一個新的執行時治理層,位於智慧體和它們呼叫的 LLM 提供商之間。它在請求離開你的環境之前強制執行支出限制並檢測敏感資料,並且每個策略事件直接流入 LangSmith,與觸發它的追蹤一起。無需設定單獨的儀表板或審計管道。
測試版包含組織、工作區、使用者和 API 金鑰級別的硬支出上限和即時成本彙總,對請求和響應的 PII 和秘密編輯,分層策略執行以及管理操作的完整審計日誌。設定只需要替換 base_url。將智慧體指向閘道器端點並使用你的 LangSmith API 金鑰,將提供商金鑰新增到工作區金鑰,然後在 UI 中配置策略即可。
當前在私有測試版中的功能:
- 組織、工作區、使用者或 API 金鑰級別的硬支出上限,達到時返回 402。
- 按工作區、使用者和 API 金鑰的即時支出可見性。
- 在請求到達模型或追蹤之前,檢測並編輯 PII 和秘密。
- 追蹤連續性,使閘道器代理的呼叫與其餘追蹤落在同一工作區。
- 與 LangSmith Engine 整合,可將策略事件進行分派,並一鍵下鑽到基礎追蹤。
- 每個管理操作的審計日誌,無需設定單獨的管道。
LangSmith Fleet 新功能
沙箱
Fleet 現在包含公開測試版的沙箱訪問,為智慧體提供編寫和執行程式碼的安全場所。這擴充套件了 Fleet 智慧體的能力,使其不僅能呼叫工具,還能分析資料、轉換檔案、生成或編輯 PDF 和 PPTX 等格式、執行 shell 命令、安裝依賴項,並在需要真實執行環境時像編碼智慧體一樣工作。
每個沙箱為智慧體提供隔離的檔案系統和命令環境,由 LangSmith Sandboxes 提供支援。在 Fleet 中,沙箱可以限定到聊天執行緒或智慧體,因此智慧體可以線上程間重用同一環境,或在每次聊天中重用同一臺計算機。空閒沙箱的預設軟 TTL 為 15 分鐘,這既保持了效率,又避免了非活動會話的持續成本,同時不會銷燬沙箱的內容。
透過沙箱,Fleet 智慧體可以處理更復雜的工作,包括:
- 資料分析:在資料集上執行程式碼,轉換輸入並生成結構化輸出。
- 檔案生成和轉換:建立、編輯、合併、驗證或轉換 PDF、電子表格和幻燈片等檔案。
- 編碼任務:重現問題、編輯檔案、安裝依賴項和執行測試。
- 本地工具和 CLI:使用命令列工具或本地 MCP 伺服器訪問尚未有 Fleet 整合的一流服務。
- 預建編碼智慧體:為需要跨執行緒持久工作(包含檔案、命令和狀態)的智慧體提供動力。
預建智慧體
我們正在擴充套件 Fleet 智慧體模板,增加了五個預建智慧體,LangChain 團隊每天都在使用它們。這些智慧體處理跨多個工具和活動的複雜、長時間執行的工作。其中一些智慧體非常複雜,以至於整個公司已經圍繞類似概念建立。它們全部免費隨 Fleet 提供,開箱即用。
自推出初始模板以來,我們瞭解到,定製是區分通用智慧體和真正提供價值的智慧體的關鍵。因此,每個預建智慧體現在都包含一個引導流程,詢問其所需的詳細資訊以適應使用者的上下文。例如,GTM 智慧體會詢問你的行業、產品和客戶,以確定如何研究賬戶和起草對外溝通。從那裡,你透過使用它並給出反饋來進一步細化智慧體。
新的預建智慧體:
- 編碼智慧體(基於 Open SWE):連線到你的程式碼庫,端到端處理編碼任務,從起草更改到開啟 PR。
- GTM 智慧體:回答關於客戶健康和使用的臨時問題,標記問題,並起草對外溝通。它是銷售和營銷團隊的得力助手。
- X 內容管理器:監控 X 平臺上與你的業務相關的話題,為你起草待稽核的帖子,並幫助你參與對你的業務重要的對話。
- 行政助理:處理收件箱分揀、日程安排和會議準備,讓你專注於需要你判斷的工作。
[由於 AI 成本控制,原文截斷]