AI News HubLIVE
站内改写

我们在 Interrupt 上发布的所有产品

LangChain 在 Interrupt 2026 上发布了一系列新产品和功能,旨在帮助团队加速智能体开发周期,包括自动调试、托管基础设施、可观测性和治理等。

文章情报

工程师入门

要点

  • LangSmith Engine 可自动监控生产环境中的追踪数据,聚类故障并生成修复 PR。
  • Managed Deep Agents 提供 API 优先的托管运行时,用于创建和运行深度智能体。
  • SmithDB 是专为智能体可观测性设计的数据库,性能提升高达 15 倍。
  • LangSmith LLM Gateway 在运行时强制实施支出限制并检测敏感数据。

为什么重要

这条新闻值得关注,因为LangSmith Engine 可自动监控生产环境中的追踪数据,聚类故障并生成修复 PR。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

在今天的 Interrupt 大会上,我们宣布了大量新产品和功能,旨在帮助团队加速智能体开发周期。有些产品负责处理需要团队花费数月才能自行搭建的基础设施,其他产品则帮助你更快地发现故障、理解原因并自动修复。以下是我们的发布内容。

LangSmith Engine

到目前为止,改进智能体仍然是一个手动过程:阅读追踪、寻找模式、编写评估、创建修复。LangSmith Engine 是一个自主运行的智能体,它可以为你自动执行这一循环。它会监控生产环境中的追踪数据,将故障聚类为命名问题,针对代码诊断根本原因,并提出修复和评估覆盖方案,以防止回归问题再次出现。你只需审核并合并改进即可。

对于每个引擎发现的问题,它可以:

  • 打开一个包含针对性代码或提示修复的 PR。
  • 创建一个自定义在线评估器,专门针对该问题,使重复出现的问题自动被重新发现。
  • 将失败的追踪作为真实示例添加到你的离线评估套件中。

Engine 基于 LangSmith 现有的追踪和评估基础设施构建,因此可以轻松集成到团队已有的工作流程中。Cogent 和 Campfire 已经使用它解决了影响数千条追踪的问题。目前已公开测试。

SmithDB

SmithDB 是专为智能体可观测性而构建的数据库,目前支持核心 LangSmith 工作负载。智能体追踪在体积和大小上呈爆炸式增长,包含深层嵌套的跨度、长时间运行的操作以及跨数小时分段到达的事件。分析这些追踪所需的查询模式(随机访问、交互式过滤、全文搜索、JSON 过滤、树感知查询、线程重建、聚合)需要一种全新的架构。

SmithDB 基于 Rust 构建,底层使用 Apache DataFusion 和 Vortex,对象存储用于持久化追踪数据,小型 Postgres 元存储,以及无状态的消息接收、查询和压缩服务。

性能:核心 LangSmith 体验速度提升高达 15 倍,P50 追踪树加载时间为 92ms,P50 单次运行加载时间为 71ms。

可移植性:基于对象存储且无状态,因此可以通过增加计算资源来扩展,并且在自托管和多云环境中比传统数据库集群更容易运行。

智能体原生查询模式:专为长时间运行的跨度、每次运行的多个事件、大型负载、全文搜索和亚秒级延迟下的 JSON 过滤而设计。

Managed Deep Agents

Managed Deep Agents 为开发者提供了一个 API 优先的托管运行时,用于在 LangSmith 中创建、运行和操作深度智能体。它基于开源的 Deep Agents 框架构建,支持能够规划、使用工具、委托给子代理、写入文件以及跨更长时间线工作的智能体,无需团队自行搭建智能体服务器或为每个智能体重建运行时基础设施。

该产品专为需要持久执行、持久上下文、工具访问、沙盒代码执行和生产环境可见性的智能体而设计。开发者可以使用熟悉的 Deep Agents 项目结构定义智能体,通过 /v1/deepagents API 以编程方式管理它们,并在 LangSmith 中检查每次运行。

关键功能包括:

  • 通过 API 创建、更新、管理和运行深度智能体的托管运行时。
  • 持久线程、流式运行、检查点和用于长时间运行任务的人机协同工作流。
  • 支持 AGENTS.md、skills/、subagents/ 和 tools.json 的智能体上下文和文件。
  • Context Hub 用于跨运行保留和更新智能体记忆、操作笔记、用户偏好和项目上下文。
  • 支持需要代码、shell 命令、文件 I/O、数据分析或工件生成的智能体的沙盒执行环境。

LangSmith Sandboxes 正式上市

LangSmith Sandboxes 是用于智能体的安全代码执行环境。它们为智能体提供带有文件系统、shell、包管理器、持久状态和网络边界的运行时,因此智能体可以编写代码、安装依赖项、运行测试、检查失败并跨更长的会话继续工作。

每个沙箱运行在硬件虚拟化的 microVM 中,与你的服务和其他沙箱隔离。这种隔离对于运行模型生成的代码、外部依赖项或用户提供的脚本的智能体尤其重要。

沙箱通过团队已经使用的相同 LangSmith SDK 和 API 密钥工作,因此团队可以轻松将安全代码执行添加到 Deep Agents、Open SWE、LangSmith Deployment、LangSmith Fleet 或自定义智能体工作流中,而无需自行构建运行时层。

GA 版本的亮点:

  • 快照和廉价分支:捕获沙箱或从 Docker 镜像构建,然后使用写时复制从该状态分叉并行沙箱。
  • 蓝图:定义可刷新的基础环境,以便新沙箱从全新的依赖项、仓库状态和预热缓存开始。
  • 空闲时暂停:空闲沙箱自动暂停,避免为未使用的资源付费。
  • Sandbox CLI:管理沙箱、构建快照、打开控制台、隧道 TCP 以及使用 ssh、scp、rsync 和 sftp 等工具。
  • 带有自定义回调的 Auth Proxy:在网络层注入凭据,使秘密不进入运行时,支持自定义秘密解析、审计钩子和域名允许/拒绝列表。

Context Hub

LangSmith Context Hub 为团队提供了一个中央位置来管理塑造智能体行为的文件,包括 AGENTS.md 文件、技能、策略、示例和其他智能体读取和遵循的上下文包。

上下文通常与框架代码不同。它变化迅速,因为团队不断优化指令、更新示例、添加策略并学习有效的方法。它也是由组织中的不同人员(包括设计师、营销人员、支持负责人、产品经理、合规团队和其他主题专家)塑造的。Context Hub 将该工作流程引入 LangSmith,以便团队无需将所有内容都通过 GitHub 即可协作处理智能体上下文。

核心功能包括:

  • 版本控制:跟踪上下文文件的更改,检查以前的版本,并在需要时回滚。
  • 标签:使用 dev、staging 或 prod 等标签标记版本,以便智能体在正确的环境中使用正确的上下文。
  • 评论:直接在上下文更改上与团队成员协作。

通过 Context Hub,团队可以将上下文视为智能体系统的一等部分,并共享用于管理决定智能体行为的指令、示例和策略的工作流程。

LangSmith LLM Gateway

LangSmith LLM Gateway 是一个新的运行时治理层,位于智能体和它们调用的 LLM 提供商之间。它在请求离开你的环境之前强制执行支出限制并检测敏感数据,并且每个策略事件直接流入 LangSmith,与触发它的追踪一起。无需设置单独的仪表板或审计管道。

测试版包含组织、工作区、用户和 API 密钥级别的硬支出上限和实时成本汇总,对请求和响应的 PII 和秘密编辑,分层策略执行以及管理操作的完整审计日志。设置只需要替换 base_url。将智能体指向网关端点并使用你的 LangSmith API 密钥,将提供商密钥添加到工作区密钥,然后在 UI 中配置策略即可。

当前在私有测试版中的功能:

  • 组织、工作区、用户或 API 密钥级别的硬支出上限,达到时返回 402。
  • 按工作区、用户和 API 密钥的实时支出可见性。
  • 在请求到达模型或追踪之前,检测并编辑 PII 和秘密。
  • 追踪连续性,使网关代理的调用与其余追踪落在同一工作区。
  • 与 LangSmith Engine 集成,可将策略事件进行分派,并一键下钻到基础追踪。
  • 每个管理操作的审计日志,无需设置单独的管道。

LangSmith Fleet 新功能

沙箱

Fleet 现在包含公开测试版的沙箱访问,为智能体提供编写和运行代码的安全场所。这扩展了 Fleet 智能体的能力,使其不仅能调用工具,还能分析数据、转换文件、生成或编辑 PDF 和 PPTX 等格式、运行 shell 命令、安装依赖项,并在需要真实执行环境时像编码智能体一样工作。

每个沙箱为智能体提供隔离的文件系统和命令环境,由 LangSmith Sandboxes 提供支持。在 Fleet 中,沙箱可以限定到聊天线程或智能体,因此智能体可以在线程间重用同一环境,或在每次聊天中重用同一台计算机。空闲沙箱的默认软 TTL 为 15 分钟,这既保持了效率,又避免了非活动会话的持续成本,同时不会销毁沙箱的内容。

通过沙箱,Fleet 智能体可以处理更复杂的工作,包括:

  • 数据分析:在数据集上运行代码,转换输入并生成结构化输出。
  • 文件生成和转换:创建、编辑、合并、验证或转换 PDF、电子表格和幻灯片等文件。
  • 编码任务:重现问题、编辑文件、安装依赖项和运行测试。
  • 本地工具和 CLI:使用命令行工具或本地 MCP 服务器访问尚未有 Fleet 集成的一流服务。
  • 预建编码智能体:为需要跨线程持久工作(包含文件、命令和状态)的智能体提供动力。

预建智能体

我们正在扩展 Fleet 智能体模板,增加了五个预建智能体,LangChain 团队每天都在使用它们。这些智能体处理跨多个工具和活动的复杂、长时间运行的工作。其中一些智能体非常复杂,以至于整个公司已经围绕类似概念建立。它们全部免费随 Fleet 提供,开箱即用。

自推出初始模板以来,我们了解到,定制是区分通用智能体和真正提供价值的智能体的关键。因此,每个预建智能体现在都包含一个引导流程,询问其所需的详细信息以适应用户的上下文。例如,GTM 智能体会询问你的行业、产品和客户,以确定如何研究账户和起草对外沟通。从那里,你通过使用它并给出反馈来进一步细化智能体。

新的预建智能体:

  • 编码智能体(基于 Open SWE):连接到你的代码库,端到端处理编码任务,从起草更改到打开 PR。
  • GTM 智能体:回答关于客户健康和使用的临时问题,标记问题,并起草对外沟通。它是销售和营销团队的得力助手。
  • X 内容管理器:监控 X 平台上与你的业务相关的话题,为你起草待审核的帖子,并帮助你参与对你的业务重要的对话。
  • 行政助理:处理收件箱分拣、日程安排和会议准备,让你专注于需要你判断的工作。

[由于 AI 成本控制,原文截断]