AI News HubLIVE
站内改写

推出 LangSmith Context Hub

LangSmith 发布 Context Hub,一个集中存储、版本管理和协作管理 AI 代理行为文件(如 AGENTS.md、技能、策略)的平台。它解决了上下文文件常由非工程人员编写且更新频繁的问题,提供版本控制、标签、评论等功能,支持 CLI 和 UI 操作,并能与 Deep Agents 集成实现持久化记忆。

文章情报

工程师入门

要点

  • Context Hub 集中管理代理上下文文件,包括 AGENTS.md、技能、策略等。
  • 上下文对代理行为影响巨大,许多失败源于缺失或过时的上下文。
  • 提供版本控制、标签(dev/staging/prod)、评论等功能。
  • 支持从 CLI、UI 或由代理自动创建上下文。

为什么重要

这条新闻值得关注,因为Context Hub 集中管理代理上下文文件,包括 AGENTS.md、技能、策略等。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

LangSmith 今日正式推出 Context Hub,这是一个全新的集中式平台,用于存储、版本管理和协作处理定义 AI 代理行为的各类文件。这些文件包括 AGENTS.md、技能文件、策略、示例以及其他代理依赖的文件包。Context Hub 为这些文件提供了一个中心化的家园,使团队能够像管理代理系统的其他关键组件一样管理它们。

上下文为何重要

代理的行为主要由三个组件塑造:模型、框架和上下文。模型负责推理和生成;框架是模型周围的代码,定义代理循环、工具、状态、权限等运行时行为;上下文则是代理读取并遵循的信息,包括系统指令、AGENTS.md 文件、技能、示例、公司策略、写作指南、支持流程和领域特定知识。上下文对代理行为有着巨大的影响。更好的模型或框架固然有帮助,但许多代理失败都源于缺失、过时或管理不善的上下文。代理可能拥有正确的工具,但仍需要正确的指令、示例和策略才能有效使用它们。甚至有人认为上下文比框架本身更值得投入。

为何上下文需要独立的空间

框架代码通常属于 GitHub 或工程团队管理代码的地方。而上下文往往需要不同的工作流程。首先,上下文通常由非工程人员管理。在 LangChain,我们将技能用于品牌设计、博客写作、产品消息等。最适合创建和审核这些文件的人往往是设计师、营销人员、支持主管、产品经理或其他领域专家。GitHub 可以适用于某些团队,但并非总是适合所有需要塑造代理行为的人。其次,上下文变化迅速。团队随着经验积累不断更新指令、优化示例、添加策略并调整技能。代理本身也可以创建和更新上下文。例如,代理可以研究某个主题,生成一组参考文件,并将其保存供未来的代理使用。

Context Hub 提供什么

Context Hub 为团队在 LangSmith 中提供了一个管理代理上下文的中央位置。它开箱即支持 AGENTS.md 文件和技能,并且足够灵活,可以存储其他文件包。核心功能包括:版本控制——跟踪上下文文件的更改、检查先前版本并在需要时回滚;标签——用 dev、staging 或 prod 等标签标记版本,以便代理在正确的环境中使用正确的上下文;评论——直接在上下文更改上与团队成员协作。目标是让上下文作为代理系统的一等公民更易于管理。

使用 LangSmith Context Hub

要使用 Context Hub,首先需要上传技能或其他文件。可以通过多种方式完成:在 UI 中手动定义、从本地计算机上传,或让代理自动创建。

手动定义:在 LangSmith UI 中打开 Context Hub,创建新仓库,选择仓库类型(技能或代理),设置句柄,然后在 UI 编辑器中直接创建文件,保存为提交并添加标签。

从本地上传:使用 LangSmith CLI。首先认证,然后在本地脚手架一个技能文件夹,编辑文件,最后推送到 Context Hub。

代理创建:代理可以自行创建上下文,这一概念最初由 Karpathy 的 LLM wiki 想法提出。

一旦上下文存在,有多种方式使用 Context Hub:同步到磁盘供编码代理读取;在 Deep Agents 中作为虚拟文件系统使用;或利用持久化记忆功能。

构建 LLM 维基示例

我们构建了一个工作流,让代理研究主题并将结果写入 Context Hub 条目。代理收集信息、整理发现,并创建文件夹供未来代理参考。该文件夹可包含摘要、来源笔记、术语、示例以及如何使用研究结果的说明。存储到 Context Hub 后,团队成员可以审查、评论、标记版本并使其可供其他代理使用。这种模式在代理需要持久知识并随时间改进时非常有用。

Context Hub 的持续学习

生产环境中的代理会遇到边缘情况、犯错以及遇到初始上下文未预见的情况。持续学习就是通过基于实际使用来改进行为以弥合差距。在实践中,大部分工作发生在上下文层:AGENTS.md、技能、策略、示例和记忆文件。Context Hub 通过保持一切版本化、可审查并立即可用于未来运行,使持续学习变得实用。大多数代理质量问题是指令、记忆或策略问题;上下文文件比模型或框架更改迭代更快;版本化的上下文结合问题跟踪可创建可重复的改进循环。

开放记忆标准

代理记忆正在逐渐形成几种常见类别:情景记忆(来自过去交互)、语义记忆(通过向量或混合搜索检索)和程序记忆(以指令、技能和策略形式)。但缺少的是跨代理、框架和数据层存储、读取、更新、版本化和移动记忆的共享方式。我们正在与 Elastic、MongoDB、Pinecone 和 Redis 合作开发代理记忆的开放标准。AGENTS.md 和技能文件已成为程序记忆的有用约定,但缺乏版本化、按环境标记以及在不同代理间移植的共享规范。我们将与合作伙伴共同定义记忆系统所需的接口、元数据、版本化模式和检索语义。