在生產環境中修復代理故障:Interrupt 2026 回顧 | LangChain 新聞通訊
LangChain 在 Interrupt 2026 大會上發佈了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
- LangSmith Engine 自動分析生產軌跡、聚類故障並推薦修復方案。
- LangSmith Sandboxes 正式發佈,提供安全的代理代碼執行環境。
公司追蹤
LangChain 最新 AI 新聞、產品、模型、生態和行業動態。
LangChain 在 Interrupt 2026 大會上發佈了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平台,用於客户支持,將代理開發時間從數月縮短至數週。該平台通過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。
AI模型在原始智能方面似乎已達到平台期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。
本文提供了一種在 AWS 上構建高度可擴展、無服務器的多智能體生成式 AI 系統的解決方案,該系統使用 LangGraph 智能體作為編排器,並與 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成。文章詳細介紹瞭如何結合 AWS Lambda 和 AWS Step Functions 等無服務器技術來構建自動擴展、實時響應且無需管理基礎設施的 LangGraph 智能體,並討論了 LangGraph 的圖執行模型如何實現確定性協調、並行處理和條件路由。此外,文章還涵蓋了一個基於此架構的營銷活動審核系統的實現,包括先決條件、部署步驟和清理指南。
本研究將飛秒激光泵浦的相干伊辛機(CIM)與大語言模型(LLM)驅動的智能體系統集成,利用LangGraph和LangChain框架實現了量子建模的自動化。LLM能夠有效執行QUBO/Ising模型校準、約束權重迭代和文獻方案驗證。所有任務均基於國產大模型和國產CIM硬件實現,完全依賴自主核心技術。研究還意外發現,智能體輔助量子計算迭代積累的知識能夠反向增強智能體自身的問題解決能力,形成新的協同範式。
一個基於LangChain4j的Java AI代理,類似於Claude Code,免費使用,需註冊Mistral賬户。首次嘗試生成了一個功能良好的計算器應用。
LangSmith的Auth Proxy通過將憑據隔離在沙箱之外,在網絡層注入認證頭,並允許團隊定義出口策略和動態憑據流程,從而為AI代理沙箱提供更安全的網絡訪問控制。
Deep Agents、LangChain 和 LangGraph 的最新流式原語引入了類型化事件、作用域訂閲、子代理可見性、多模態輸出和彈性前端體驗,支持構建生產級代理應用。
Amazon SageMaker AI 現在為實時推理端點提供 OpenAI 兼容的 API 支持。使用 OpenAI SDK、LangChain 或 Strands Agents 的用户只需更改端點 URL 即可調用 SageMaker AI 上的模型,無需自定義客户端、SigV4 包裝器或代碼重寫。該功能支持聊天補全請求和流式響應,並通過 bearer token 進行身份驗證。
深度代理現在支持解釋器:小型嵌入式運行時,代理可在其中編寫代碼以協調工具、保持工作狀態,並決定哪些內容進入模型上下文。解釋器提供了一種介於串行工具調用和完整沙盒之間的中間地帶,使代理能夠表達多步驟工作、將中間狀態保留在模型上下文之外,並以更可預測的方式執行代碼和操作。
LangSmith Engine 是一個位於代理追蹤之上的智能代理,能夠發現重複出現的問題並提出改進建議。本文詳細介紹了其技術架構,包括如何大規模篩選追蹤、識別問題、生成評估器和數據集示例,並持續更新代理概覽以優化後續運行。
2026年,企業級自主AI已從試點轉向生產。本文對Salesforce Agentforce、Microsoft Copilot Studio、ServiceNow、LangGraph等十大平台進行排名,提供已驗證的定價、實際採用數據及誠實限制,幫助團隊做出決策。
深度代理此前採用通用設計以適配各模型家族。今天,我們推出模型特定配置文件,可調整提示、工具和中間件。我們內置了針對OpenAI、Anthropic和Google模型的配置文件,在tau2-bench子集上相比默認配置實現了10-20分的提升。
itsharness是一個用於構建、運行和監控AI代理工作流的完整工具集。它提供可視化畫布設計流程,導出運行時無關的規範,編譯到不同框架,並支持運行、追蹤和調試。當前規範版本0.2.0,包含14種節點類型和5個參考流程。
本期AI新聞涵蓋多個熱點:GitHub Copilot App模仿Conductor的形態引發討論;OpenAI推出Codex移動版,支持遠程控制編碼代理;LangChain發佈SmithDB和Engine,將代理追蹤數據轉化為改進循環;Anthropic限制Claude Code使用引發開發者強烈反彈;Figure展示人形機器人24/7自主分揀直播;以及多項研究進展,包括擴散語言模型、時間序列基礎模型和可解釋性等。
LangChain 在 Interrupt 2026 上發佈了一系列新產品和功能,旨在幫助團隊加速智能體開發週期,包括自動調試、託管基礎設施、可觀測性和治理等。
LangChain Labs 是一項新的應用研究計劃,專注於智能體的持續學習,與多家合作伙伴共同推進自我改進型AI系統的開放研究。
Halgorithem 是一種無需依賴AI即可檢測AI幻覺的算法,通過將輸入文件解析為樹結構並與文件塊樹比較來標記不一致之處。該算法可輕鬆集成到LangGraph、CrewAI等Python AI工作流中,並在多項基準測試中展現出高準確率。
瞭解代理牽引系統如何將AI模型轉變為自主工作引擎。探索核心組件:文件系統、沙箱和記憶。
LangSmith推出LLM網關私有測試版,這是一層運行時治理,可在請求到達模型前強制執行成本限制和敏感數據編輯,並將策略事件直接集成到LangSmith工作區,無需額外工具。
LangSmith 發佈 Context Hub,一個集中存儲、版本管理和協作管理 AI 代理行為文件(如 AGENTS.md、技能、策略)的平台。它解決了上下文文件常由非工程人員編寫且更新頻繁的問題,提供版本控制、標籤、評論等功能,支持 CLI 和 UI 操作,並能與 Deep Agents 集成實現持久化記憶。
LangSmith Sandbox 現已正式發佈 (GA),提供基於硬件虛擬化的微虛擬機,實現內核級隔離,確保運行不受信任的AI生成代碼的安全性。新特性包括快照與分支、服務URL、CLI工具、認證代理等,適用於編碼代理、CI代理和數據管道等場景。
LangChain推出Managed Deep Agents私有測試版,提供API優先的託管運行時,處理持久化執行、沙箱、工具訪問和可觀測性,讓開發者專注於代理行為而非基礎設施。
Torrix 是一款自託管的 LLM 可觀測性工具,支持跟蹤令牌數、成本、延遲、完整提示追蹤、推理令牌捕獲和 PII 脱敏。兼容 OpenAI、Anthropic、Google Gemini 等眾多提供商。通過 Docker 一鍵部署,無需 Postgres 或 Redis。提供 Python、Node.js、Go、C#、Java SDK 以及 LangChain 回調和 HTTP 代理。
OncoAgent是一個開源、隱私保護的腫瘤臨牀決策支持系統。它採用雙層大語言模型架構(9B快速模型和27B深度推理模型)、多智能體LangGraph拓撲、糾正性RAG流程(涵蓋70餘項NCCN和ESMO指南)以及三層反射安全驗證器。系統通過複雜性評分路由查詢,在AMD Instinct MI300X上微調,實現了56倍的吞吐量加速,並支持本地部署以確保數據主權。
本文介紹了代理開發生命週期的四個階段:構建、測試、部署和監控。強調了在部署前進行測試、使用運行時和沙箱進行可靠部署、以及通過追蹤和反饋進行監控的重要性。涵蓋了從代碼優先到無代碼的多種工具,並討論了評估數據集、模擬和信號採集等最佳實踐。
記憶對人類思維和AI代理的行為至關重要。本文從認知科學角度出發,介紹了AI代理的短時記憶、情景記憶、語義記憶和長時記憶等類型,並探討了它們的設計權衡。通過LangGraph在Google Colab中的實踐演示,展示瞭如何構建包含多種記憶模式的AI代理。
本文詳細介紹瞭如何利用 LangChain 的 Deep Agents 進行編排和 Parallel 的 Task API 進行結構化網絡研究,構建自動化公司盡職調查智能體。該智能體包含五個研究子智能體,並通過 LangSmith 實現合規可觀測性,確保每項主張都有源可查。
本教程詳細演示瞭如何利用Groq的免費OpenAI兼容推理端點,結合LangGraph、LangChain以及自定義工具(包括網頁搜索、文件操作、Python執行、技能加載、子代理委派和長期記憶),構建一個可運行的多步驟研究代理。通過一個實際任務(小型語言模型簡報),展示了代理發現技能、委派子研究、生成結構化輸出和保存記憶的完整流程。
本文由LangChain創始人Harrison Chase撰寫,闡述了智能體可觀測性的核心價值不僅是調試,而是驅動學習循環。他強調,僅靠追蹤是不夠的,必須結合反饋信號(用户反饋、間接信號、大模型評判、規則等)才能系統地改進模型、框架和上下文。文章詳細探討了學習發生的多個層面(模型、框架、上下文),以及如何通過追蹤與反饋結合實現人工或自動化的持續改進。最後,他指出一個完善的可觀測性平台應具備存儲追蹤、存儲反饋和生成反饋三大能力。
赫伯羅特數字客户體驗團隊利用Amazon Bedrock、Elasticsearch和LangChain/LangGraph構建了基於生成式AI的反饋分析解決方案,自動進行情感分類、趨勢分析和報告生成,減少人工工作,實現更快的數據驅動產品決策。
像GLM-5和MiniMax M2.7這樣的開放權重模型在核心智能體任務(文件操作、工具使用、指令遵循)上已媲美封閉前沿模型,同時成本更低、延遲更短。LangChain的評估顯示其正確率接近頂級閉源模型,使開放模型適用於生產環境。本文詳細介紹評估方法、結果及如何在Deep Agents SDK中使用開放模型。
LangChain宣佈將於2026年5月13日至14日在舊金山Midway舉辦第二屆Interrupt大會,聚焦企業級Agent的規模化部署。大會將邀請Harrison Chase、Andrew Ng、MongoDB CEO Chirantan Desai及Box CEO Aaron Levie等嘉賓,分享Lyft、LinkedIn等企業的生產實踐,並提供產品演示、工作坊和AMA環節。
LangSmith 的迴歸測試功能幫助 AI 工程師通過比較實驗、跟蹤性能並深入分析運行間的變化,自信地評估和迭代 LLM 應用。與傳統的軟件測試不同,AI 測試可能無法獲得滿分,因此隨時間追蹤結果並比較單個數據點至關重要。LangSmith 提供了比較視圖、顯示選項、基線運行中自動高亮變化的數據點、過濾以及展開行詳細查看等功能,使快速迭代和探索數據變得簡單。
LangSmith 是一個用於 LLM 應用的統一 DevOps 平台,現已在 Azure 市場中作為 Azure Kubernetes 應用提供,支持在 Azure VPC 內部署,完全控制數據,並支持 MACC 信用額度。
Dosu公司採用評估驅動開發(EDD)和LangSmith來構建可靠的LLM產品,監控生產性能,並自信地進行迭代。本文詳細介紹了Dosu的起源、早期挑戰、如何實施EDD以及利用LangSmith大規模監控和改進產品。
LangSmith 推出了測試運行對比功能,允許用户並排查看多個測試運行的結果,結合人工檢查和自動評估,更高效地優化 LLM 應用。
多代理系統模擬真實工程團隊,不僅能更快編寫代碼,還能將調試時間縮短93%並壓縮跨團隊交付。本文介紹了基於LangGraph的架構及其在Cisco的試點成果。
LLM智能體在生產環境中的行為與傳統軟件截然不同,需要新的可觀測性方法。本文探討了智能體監控的獨特挑戰,包括無限輸入空間、非確定性行為,以及如何通過標註隊列、LLM替代人工評估和專用工具(如LangSmith的Insights Agent、在線評估和儀表板)來擴展評估,並強調了跨職能團隊協作的重要性。
本文介紹瞭如何在自己的計算機上使用小型語言模型(SLM)構建完全本地運行的AI代理,無需互聯網連接或API費用。涵蓋AI代理和SLM的概念、本地運行的優勢、Ollama和LangChain的設置、逐步構建代理以及添加記憶和工具的方法,並討論了SLM的侷限性。
Cerebras生態系統正將超低延遲推理從差異化優勢轉變為關鍵基礎設施。通過其晶圓級芯片架構,Cerebras在推理速度上比傳統GPU系統快15倍,並迅速擴展模型支持、雲服務和開發者工具集成,使開發者能夠輕鬆利用這一速度構建從代理、編碼助手到語音界面等新一代應用。生態系統的快速擴展——包括支持主流開源模型、通過雲市場提供服務、以及集成LangChain、Docker等工具——正在將速度轉化為實際生產力,推動AI推理進入寬帶時代。