在生產環境中修復代理故障:Interrupt 2026 回顧 | LangChain 新聞通訊
LangChain 在 Interrupt 2026 大會上釋出了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
- LangSmith Engine 自動分析生產軌跡、聚類故障並推薦修復方案。
- LangSmith Sandboxes 正式釋出,提供安全的代理程式碼執行環境。
公司追蹤
LangChain 最新 AI 新聞、產品、模型、生態和產業動態。
LangChain 在 Interrupt 2026 大會上釋出了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平臺,用於客戶支援,將代理開發時間從數月縮短至數週。該平臺透過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。
AI模型在原始智慧方面似乎已達到平臺期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。
本文提供了一種在 AWS 上構建高度可擴充套件、無伺服器的多智慧體生成式 AI 系統的解決方案,該系統使用 LangGraph 智慧體作為編排器,並與 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 整合。文章詳細介紹瞭如何結合 AWS Lambda 和 AWS Step Functions 等無伺服器技術來構建自動擴充套件、即時響應且無需管理基礎設施的 LangGraph 智慧體,並討論了 LangGraph 的圖執行模型如何實現確定性協調、並行處理和條件路由。此外,文章還涵蓋了一個基於此架構的營銷活動稽核系統的實現,包括先決條件、部署步驟和清理指南。
本研究將飛秒雷射泵浦的相干伊辛機(CIM)與大語言模型(LLM)驅動的智慧體系統整合,利用LangGraph和LangChain框架實現了量子建模的自動化。LLM能夠有效執行QUBO/Ising模型校準、約束權重迭代和文獻方案驗證。所有任務均基於國產大模型和國產CIM硬體實現,完全依賴自主核心技術。研究還意外發現,智慧體輔助量子計算迭代積累的知識能夠反向增強智慧體自身的問題解決能力,形成新的協同正規化。
一個基於LangChain4j的Java AI代理,類似於Claude Code,免費使用,需註冊Mistral賬戶。首次嘗試生成了一個功能良好的計算器應用。
LangSmith的Auth Proxy透過將憑據隔離在沙箱之外,在網路層注入認證頭,並允許團隊定義出口策略和動態憑據流程,從而為AI代理沙箱提供更安全的網路訪問控制。
Deep Agents、LangChain 和 LangGraph 的最新流式原語引入了型別化事件、作用域訂閱、子代理可見性、多模態輸出和彈性前端體驗,支援構建生產級代理應用。
Amazon SageMaker AI 現在為即時推理端點提供 OpenAI 相容的 API 支援。使用 OpenAI SDK、LangChain 或 Strands Agents 的使用者只需更改端點 URL 即可呼叫 SageMaker AI 上的模型,無需自定義客戶端、SigV4 包裝器或程式碼重寫。該功能支援聊天補全請求和流式響應,並透過 bearer token 進行身份驗證。
深度代理現在支援直譯器:小型嵌入式執行時,代理可在其中編寫程式碼以協調工具、保持工作狀態,並決定哪些內容進入模型上下文。直譯器提供了一種介於序列工具呼叫和完整沙盒之間的中間地帶,使代理能夠表達多步驟工作、將中間狀態保留在模型上下文之外,並以更可預測的方式執行程式碼和操作。
LangSmith Engine 是一個位於代理追蹤之上的智慧代理,能夠發現重複出現的問題並提出改進建議。本文詳細介紹了其技術架構,包括如何大規模篩選追蹤、識別問題、生成評估器和資料集示例,並持續更新代理概覽以最佳化後續執行。
2026年,企業級自主AI已從試點轉向生產。本文對Salesforce Agentforce、Microsoft Copilot Studio、ServiceNow、LangGraph等十大平臺進行排名,提供已驗證的定價、實際採用資料及誠實限制,幫助團隊做出決策。
深度代理此前採用通用設計以適配各模型家族。今天,我們推出模型特定配置檔案,可調整提示、工具和中介軟體。我們內建了針對OpenAI、Anthropic和Google模型的配置檔案,在tau2-bench子集上相比預設配置實現了10-20分的提升。
itsharness是一個用於構建、執行和監控AI代理工作流的完整工具集。它提供視覺化畫布設計流程,匯出執行時無關的規範,編譯到不同框架,並支援執行、追蹤和除錯。當前規範版本0.2.0,包含14種節點型別和5個參考流程。
本期AI新聞涵蓋多個熱點:GitHub Copilot App模仿Conductor的形態引發討論;OpenAI推出Codex移動版,支援遠端控制編碼代理;LangChain釋出SmithDB和Engine,將代理追蹤資料轉化為改進迴圈;Anthropic限制Claude Code使用引發開發者強烈反彈;Figure展示人形機器人24/7自主分揀直播;以及多項研究進展,包括擴散語言模型、時間序列基礎模型和可解釋性等。
LangChain 在 Interrupt 2026 上釋出了一系列新產品和功能,旨在幫助團隊加速智慧體開發週期,包括自動除錯、託管基礎設施、可觀測性和治理等。
LangChain Labs 是一項新的應用研究計劃,專注於智慧體的持續學習,與多家合作伙伴共同推進自我改進型AI系統的開放研究。
Halgorithem 是一種無需依賴AI即可檢測AI幻覺的演算法,透過將輸入檔案解析為樹結構並與檔案塊樹比較來標記不一致之處。該演算法可輕鬆整合到LangGraph、CrewAI等Python AI工作流中,並在多項基準測試中展現出高準確率。
瞭解代理牽引系統如何將AI模型轉變為自主工作引擎。探索核心元件:檔案系統、沙箱和記憶。
LangSmith推出LLM閘道器私有測試版,這是一層執行時治理,可在請求到達模型前強制執行成本限制和敏感資料編輯,並將策略事件直接整合到LangSmith工作區,無需額外工具。
LangSmith 釋出 Context Hub,一個集中儲存、版本管理和協作管理 AI 代理行為檔案(如 AGENTS.md、技能、策略)的平臺。它解決了上下文檔案常由非工程人員編寫且更新頻繁的問題,提供版本控制、標籤、評論等功能,支援 CLI 和 UI 操作,並能與 Deep Agents 整合實現持久化記憶。
LangSmith Sandbox 現已正式釋出 (GA),提供基於硬體虛擬化的微虛擬機器,實現核心級隔離,確保執行不受信任的AI生成程式碼的安全性。新特性包括快照與分支、服務URL、CLI工具、認證代理等,適用於編碼代理、CI代理和資料管道等場景。
LangChain推出Managed Deep Agents私有測試版,提供API優先的託管執行時,處理持久化執行、沙箱、工具訪問和可觀測性,讓開發者專注於代理行為而非基礎設施。
Torrix 是一款自託管的 LLM 可觀測性工具,支援跟蹤令牌數、成本、延遲、完整提示追蹤、推理令牌捕獲和 PII 脫敏。相容 OpenAI、Anthropic、Google Gemini 等眾多提供商。透過 Docker 一鍵部署,無需 Postgres 或 Redis。提供 Python、Node.js、Go、C#、Java SDK 以及 LangChain 回撥和 HTTP 代理。
OncoAgent是一個開源、隱私保護的腫瘤臨床決策支援系統。它採用雙層大語言模型架構(9B快速模型和27B深度推理模型)、多智慧體LangGraph拓撲、糾正性RAG流程(涵蓋70餘項NCCN和ESMO指南)以及三層反射安全驗證器。系統透過複雜性評分路由查詢,在AMD Instinct MI300X上微調,實現了56倍的吞吐量加速,並支援本地部署以確保資料主權。
本文介紹了代理開發生命週期的四個階段:構建、測試、部署和監控。強調了在部署前進行測試、使用執行時和沙箱進行可靠部署、以及透過追蹤和反饋進行監控的重要性。涵蓋了從程式碼優先到無程式碼的多種工具,並討論了評估資料集、模擬和訊號採集等最佳實踐。
記憶對人類思維和AI代理的行為至關重要。本文從認知科學角度出發,介紹了AI代理的短時記憶、情景記憶、語義記憶和長時記憶等型別,並探討了它們的設計權衡。透過LangGraph在Google Colab中的實踐演示,展示瞭如何構建包含多種記憶模式的AI代理。
本文詳細介紹瞭如何利用 LangChain 的 Deep Agents 進行編排和 Parallel 的 Task API 進行結構化網路研究,構建自動化公司盡職調查智慧體。該智慧體包含五個研究子智慧體,並透過 LangSmith 實現合規可觀測性,確保每項主張都有源可查。
本教程詳細演示瞭如何利用Groq的免費OpenAI相容推理端點,結合LangGraph、LangChain以及自定義工具(包括網頁搜尋、檔案操作、Python執行、技能載入、子代理委派和長期記憶),構建一個可執行的多步驟研究代理。透過一個實際任務(小型語言模型簡報),展示了代理發現技能、委派子研究、生成結構化輸出和儲存記憶的完整流程。
本文由LangChain創始人Harrison Chase撰寫,闡述了智慧體可觀測性的核心價值不僅是除錯,而是驅動學習迴圈。他強調,僅靠追蹤是不夠的,必須結合反饋訊號(使用者反饋、間接訊號、大模型評判、規則等)才能系統地改進模型、框架和上下文。文章詳細探討了學習發生的多個層面(模型、框架、上下文),以及如何透過追蹤與反饋結合實現人工或自動化的持續改進。最後,他指出一個完善的可觀測性平臺應具備儲存追蹤、儲存反饋和生成反饋三大能力。
赫伯羅特數字客戶體驗團隊利用Amazon Bedrock、Elasticsearch和LangChain/LangGraph構建了基於生成式AI的反饋分析解決方案,自動進行情感分類、趨勢分析和報告生成,減少人工工作,實現更快的資料驅動產品決策。
像GLM-5和MiniMax M2.7這樣的開放權重模型在核心智慧體任務(檔案操作、工具使用、指令遵循)上已媲美封閉前沿模型,同時成本更低、延遲更短。LangChain的評估顯示其正確率接近頂級閉源模型,使開放模型適用於生產環境。本文詳細介紹評估方法、結果及如何在Deep Agents SDK中使用開放模型。
LangChain宣佈將於2026年5月13日至14日在舊金山Midway舉辦第二屆Interrupt大會,聚焦企業級Agent的規模化部署。大會將邀請Harrison Chase、Andrew Ng、MongoDB CEO Chirantan Desai及Box CEO Aaron Levie等嘉賓,分享Lyft、LinkedIn等企業的生產實踐,並提供產品演示、工作坊和AMA環節。
LangSmith 的迴歸測試功能幫助 AI 工程師透過比較實驗、跟蹤效能並深入分析執行間的變化,自信地評估和迭代 LLM 應用。與傳統的軟體測試不同,AI 測試可能無法獲得滿分,因此隨時間追蹤結果並比較單個資料點至關重要。LangSmith 提供了比較檢視、顯示選項、基線執行中自動高亮變化的資料點、過濾以及展開行詳細檢視等功能,使快速迭代和探索資料變得簡單。
LangSmith 是一個用於 LLM 應用的統一 DevOps 平臺,現已在 Azure 市場中作為 Azure Kubernetes 應用提供,支援在 Azure VPC 內部署,完全控制資料,並支援 MACC 信用額度。
Dosu公司採用評估驅動開發(EDD)和LangSmith來構建可靠的LLM產品,監控生產效能,並自信地進行迭代。本文詳細介紹了Dosu的起源、早期挑戰、如何實施EDD以及利用LangSmith大規模監控和改進產品。
LangSmith 推出了測試執行對比功能,允許使用者並排檢視多個測試執行的結果,結合人工檢查和自動評估,更高效地最佳化 LLM 應用。
多代理系統模擬真實工程團隊,不僅能更快編寫程式碼,還能將除錯時間縮短93%並壓縮跨團隊交付。本文介紹了基於LangGraph的架構及其在Cisco的試點成果。
LLM智慧體在生產環境中的行為與傳統軟體截然不同,需要新的可觀測性方法。本文探討了智慧體監控的獨特挑戰,包括無限輸入空間、非確定性行為,以及如何透過標註佇列、LLM替代人工評估和專用工具(如LangSmith的Insights Agent、線上評估和儀表板)來擴充套件評估,並強調了跨職能團隊協作的重要性。
本文介紹瞭如何在自己的計算機上使用小型語言模型(SLM)構建完全本地執行的AI代理,無需網際網路連線或API費用。涵蓋AI代理和SLM的概念、本地執行的優勢、Ollama和LangChain的設定、逐步構建代理以及新增記憶和工具的方法,並討論了SLM的侷限性。
Cerebras生態系統正將超低延遲推理從差異化優勢轉變為關鍵基礎設施。透過其晶圓級晶片架構,Cerebras在推理速度上比傳統GPU系統快15倍,並迅速擴充套件模型支援、雲服務和開發者工具整合,使開發者能夠輕鬆利用這一速度構建從代理、編碼助手到語音介面等新一代應用。生態系統的快速擴充套件——包括支援主流開源模型、透過雲市場提供服務、以及整合LangChain、Docker等工具——正在將速度轉化為實際生產力,推動AI推理進入寬頻時代。