我們在 Interrupt 上發佈的所有產品
LangChain 在 Interrupt 2026 上發佈了一系列新產品和功能,旨在幫助團隊加速智能體開發週期,包括自動調試、託管基礎設施、可觀測性和治理等。
文章情報
要點
- LangSmith Engine 可自動監控生產環境中的追蹤數據,聚類故障並生成修復 PR。
- Managed Deep Agents 提供 API 優先的託管運行時,用於創建和運行深度智能體。
- SmithDB 是專為智能體可觀測性設計的數據庫,性能提升高達 15 倍。
- LangSmith LLM Gateway 在運行時強制實施支出限制並檢測敏感數據。
為甚麼重要
這條新聞值得關注,因為LangSmith Engine 可自動監控生產環境中的追蹤數據,聚類故障並生成修復 PR。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
在今天的 Interrupt 大會上,我們宣佈了大量新產品和功能,旨在幫助團隊加速智能體開發週期。有些產品負責處理需要團隊花費數月才能自行搭建的基礎設施,其他產品則幫助你更快地發現故障、理解原因並自動修復。以下是我們的發佈內容。
LangSmith Engine
到目前為止,改進智能體仍然是一個手動過程:閲讀追蹤、尋找模式、編寫評估、創建修復。LangSmith Engine 是一個自主運行的智能體,它可以為你自動執行這一循環。它會監控生產環境中的追蹤數據,將故障聚類為命名問題,針對代碼診斷根本原因,並提出修復和評估覆蓋方案,以防止迴歸問題再次出現。你只需審核併合並改進即可。
對於每個引擎發現的問題,它可以:
- 打開一個包含針對性代碼或提示修復的 PR。
- 創建一個自定義在線評估器,專門針對該問題,使重複出現的問題自動被重新發現。
- 將失敗的追蹤作為真實示例添加到你的離線評估套件中。
Engine 基於 LangSmith 現有的追蹤和評估基礎設施構建,因此可以輕鬆集成到團隊已有的工作流程中。Cogent 和 Campfire 已經使用它解決了影響數千條追蹤的問題。目前已公開測試。
SmithDB
SmithDB 是專為智能體可觀測性而構建的數據庫,目前支持核心 LangSmith 工作負載。智能體追蹤在體積和大小上呈爆炸式增長,包含深層嵌套的跨度、長時間運行的操作以及跨數小時分段到達的事件。分析這些追蹤所需的查詢模式(隨機訪問、交互式過濾、全文搜索、JSON 過濾、樹感知查詢、線程重建、聚合)需要一種全新的架構。
SmithDB 基於 Rust 構建,底層使用 Apache DataFusion 和 Vortex,對象存儲用於持久化追蹤數據,小型 Postgres 元存儲,以及無狀態的消息接收、查詢和壓縮服務。
性能:核心 LangSmith 體驗速度提升高達 15 倍,P50 追蹤樹加載時間為 92ms,P50 單次運行加載時間為 71ms。
可移植性:基於對象存儲且無狀態,因此可以通過增加計算資源來擴展,並且在自託管和多雲環境中比傳統數據庫集羣更容易運行。
智能體原生查詢模式:專為長時間運行的跨度、每次運行的多個事件、大型負載、全文搜索和亞秒級延遲下的 JSON 過濾而設計。
Managed Deep Agents
Managed Deep Agents 為開發者提供了一個 API 優先的託管運行時,用於在 LangSmith 中創建、運行和操作深度智能體。它基於開源的 Deep Agents 框架構建,支持能夠規劃、使用工具、委託給子代理、寫入文件以及跨更長時間線工作的智能體,無需團隊自行搭建智能體服務器或為每個智能體重建運行時基礎設施。
該產品專為需要持久執行、持久上下文、工具訪問、沙盒代碼執行和生產環境可見性的智能體而設計。開發者可以使用熟悉的 Deep Agents 項目結構定義智能體,通過 /v1/deepagents API 以編程方式管理它們,並在 LangSmith 中檢查每次運行。
關鍵功能包括:
- 通過 API 創建、更新、管理和運行深度智能體的託管運行時。
- 持久線程、流式運行、檢查點和用於長時間運行任務的人機協同工作流。
- 支持 AGENTS.md、skills/、subagents/ 和 tools.json 的智能體上下文和文件。
- Context Hub 用於跨運行保留和更新智能體記憶、操作筆記、用户偏好和項目上下文。
- 支持需要代碼、shell 命令、文件 I/O、數據分析或工件生成的智能體的沙盒執行環境。
LangSmith Sandboxes 正式上市
LangSmith Sandboxes 是用於智能體的安全代碼執行環境。它們為智能體提供帶有文件系統、shell、包管理器、持久狀態和網絡邊界的運行時,因此智能體可以編寫代碼、安裝依賴項、運行測試、檢查失敗並跨更長的會話繼續工作。
每個沙箱運行在硬件虛擬化的 microVM 中,與你的服務和其他沙箱隔離。這種隔離對於運行模型生成的代碼、外部依賴項或用户提供的腳本的智能體尤其重要。
沙箱通過團隊已經使用的相同 LangSmith SDK 和 API 密鑰工作,因此團隊可以輕鬆將安全代碼執行添加到 Deep Agents、Open SWE、LangSmith Deployment、LangSmith Fleet 或自定義智能體工作流中,而無需自行構建運行時層。
GA 版本的亮點:
- 快照和廉價分支:捕獲沙箱或從 Docker 鏡像構建,然後使用寫時複製從該狀態分叉並行沙箱。
- 藍圖:定義可刷新的基礎環境,以便新沙箱從全新的依賴項、倉庫狀態和預熱緩存開始。
- 空閒時暫停:空閒沙箱自動暫停,避免為未使用的資源付費。
- Sandbox CLI:管理沙箱、構建快照、打開控制台、隧道 TCP 以及使用 ssh、scp、rsync 和 sftp 等工具。
- 帶有自定義回調的 Auth Proxy:在網絡層注入憑據,使秘密不進入運行時,支持自定義秘密解析、審計鈎子和域名允許/拒絕列表。
Context Hub
LangSmith Context Hub 為團隊提供了一箇中央位置來管理塑造智能體行為的文件,包括 AGENTS.md 文件、技能、策略、示例和其他智能體讀取和遵循的上下文包。
上下文通常與框架代碼不同。它變化迅速,因為團隊不斷優化指令、更新示例、添加策略並學習有效的方法。它也是由組織中的不同人員(包括設計師、營銷人員、支持負責人、產品經理、合規團隊和其他主題專家)塑造的。Context Hub 將該工作流程引入 LangSmith,以便團隊無需將所有內容都通過 GitHub 即可協作處理智能體上下文。
核心功能包括:
- 版本控制:跟蹤上下文文件的更改,檢查以前的版本,並在需要時回滾。
- 標籤:使用 dev、staging 或 prod 等標籤標記版本,以便智能體在正確的環境中使用正確的上下文。
- 評論:直接在上下文更改上與團隊成員協作。
通過 Context Hub,團隊可以將上下文視為智能體系統的一等部分,並共享用於管理決定智能體行為的指令、示例和策略的工作流程。
LangSmith LLM Gateway
LangSmith LLM Gateway 是一個新的運行時治理層,位於智能體和它們調用的 LLM 提供商之間。它在請求離開你的環境之前強制執行支出限制並檢測敏感數據,並且每個策略事件直接流入 LangSmith,與觸發它的追蹤一起。無需設置單獨的儀表板或審計管道。
測試版包含組織、工作區、用户和 API 密鑰級別的硬支出上限和實時成本彙總,對請求和響應的 PII 和秘密編輯,分層策略執行以及管理操作的完整審計日誌。設置只需要替換 base_url。將智能體指向網關端點並使用你的 LangSmith API 密鑰,將提供商密鑰添加到工作區密鑰,然後在 UI 中配置策略即可。
當前在私有測試版中的功能:
- 組織、工作區、用户或 API 密鑰級別的硬支出上限,達到時返回 402。
- 按工作區、用户和 API 密鑰的實時支出可見性。
- 在請求到達模型或追蹤之前,檢測並編輯 PII 和秘密。
- 追蹤連續性,使網關代理的調用與其餘追蹤落在同一工作區。
- 與 LangSmith Engine 集成,可將策略事件進行分派,並一鍵下鑽到基礎追蹤。
- 每個管理操作的審計日誌,無需設置單獨的管道。
LangSmith Fleet 新功能
沙箱
Fleet 現在包含公開測試版的沙箱訪問,為智能體提供編寫和運行代碼的安全場所。這擴展了 Fleet 智能體的能力,使其不僅能調用工具,還能分析數據、轉換文件、生成或編輯 PDF 和 PPTX 等格式、運行 shell 命令、安裝依賴項,並在需要真實執行環境時像編碼智能體一樣工作。
每個沙箱為智能體提供隔離的文件系統和命令環境,由 LangSmith Sandboxes 提供支持。在 Fleet 中,沙箱可以限定到聊天線程或智能體,因此智能體可以在線程間重用同一環境,或在每次聊天中重用同一台計算機。空閒沙箱的默認軟 TTL 為 15 分鐘,這既保持了效率,又避免了非活動會話的持續成本,同時不會銷燬沙箱的內容。
通過沙箱,Fleet 智能體可以處理更復雜的工作,包括:
- 數據分析:在數據集上運行代碼,轉換輸入並生成結構化輸出。
- 文件生成和轉換:創建、編輯、合併、驗證或轉換 PDF、電子表格和幻燈片等文件。
- 編碼任務:重現問題、編輯文件、安裝依賴項和運行測試。
- 本地工具和 CLI:使用命令行工具或本地 MCP 服務器訪問尚未有 Fleet 集成的一流服務。
- 預建編碼智能體:為需要跨線程持久工作(包含文件、命令和狀態)的智能體提供動力。
預建智能體
我們正在擴展 Fleet 智能體模板,增加了五個預建智能體,LangChain 團隊每天都在使用它們。這些智能體處理跨多個工具和活動的複雜、長時間運行的工作。其中一些智能體非常複雜,以至於整個公司已經圍繞類似概念建立。它們全部免費隨 Fleet 提供,開箱即用。
自推出初始模板以來,我們瞭解到,定製是區分通用智能體和真正提供價值的智能體的關鍵。因此,每個預建智能體現在都包含一個引導流程,詢問其所需的詳細信息以適應用户的上下文。例如,GTM 智能體會詢問你的行業、產品和客户,以確定如何研究賬户和起草對外溝通。從那裏,你通過使用它並給出反饋來進一步細化智能體。
新的預建智能體:
- 編碼智能體(基於 Open SWE):連接到你的代碼庫,端到端處理編碼任務,從起草更改到打開 PR。
- GTM 智能體:回答關於客户健康和使用的臨時問題,標記問題,並起草對外溝通。它是銷售和營銷團隊的得力助手。
- X 內容管理器:監控 X 平台上與你的業務相關的話題,為你起草待審核的帖子,並幫助你參與對你的業務重要的對話。
- 行政助理:處理收件箱分揀、日程安排和會議準備,讓你專注於需要你判斷的工作。
[由於 AI 成本控制,原文截斷]