AI News HubLIVE
站内改写

LangChain Labs 正式成立

LangChain Labs 是一项新的应用研究计划,专注于智能体的持续学习,与多家合作伙伴共同推进自我改进型AI系统的开放研究。

文章情报

工程师进阶

要点

  • LangChain Labs 聚焦智能体持续学习,利用智能体产生的数据进行自我改进。
  • 与 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等研究伙伴合作。
  • 研究方向包括成本与延迟优化、评估与模拟环境构建、以及跨模型提示优化。

为什么重要

这条新闻值得关注,因为LangChain Labs 聚焦智能体持续学习,利用智能体产生的数据进行自我改进。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

近日,LangChain 宣布成立 LangChain Labs,这是一个全新的应用研究团队,旨在推动智能体持续学习的开放研究。该实验室专注于利用智能体在实际运行中产生的数据——包括追踪记录、用户反馈、评估结果和生产行为——来帮助智能体不断自我改进。

LangChain 认为,每次智能体运行都蕴含着有价值的信息,但如何从海量数据中提取有效信号并将其转化为可用的改进措施,仍是当前面临的关键挑战。而 LangChain 旗下的 LangSmith 平台正是为数据捕捉、转换和存储而生,这为 LangChain Labs 在持续学习领域的研究提供了先发优势。

LangChain Labs 已与 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等领先机构建立了研究合作伙伴关系。Harvey 应用研究主管 Niko Grupen 表示:“我们很高兴与 LangChain Labs 团队合作,推动针对复杂法律工作的高效、自我改进型智能体的应用研究。”

研究初期将聚焦以下方向:

  1. 从大规模智能体数据中挖掘改进信息:随着智能体快速融入软件系统,它们将在短时间内产生前所未有的数据量。如何从这些数据中提取有效信号用于评估/模拟环境生成、工程优化和后续训练,仍是难题。LangChain 希望帮助团队利用追踪数据构建更好的智能体。
  1. 实现帕累托前沿的高效智能体:智能体在成本、延迟和任务性能方面面临实际约束。对于许多关键任务,我们尚未找到模型、工程和反馈循环的最优组合,使智能体实现自我改进。
  1. 系统化构建评估与模拟环境:为了正确评估智能体,通常需要在其生产环境的代表性环境中进行端到端测试。这些环境创建起来既困难又耗时。LangChain 正在研究简化环境创建和运行的方法,以支持评估、模拟和强化学习。
  1. 提示优化:提示策略因模型系列而异,在不同模型之间迁移往往繁琐且耗时。LangChain 相信多模型未来,团队应能轻松为任务选择合适模型。跨模型的提示优化有助于简化迁移过程并减少手动调优工作量。

早期合作项目包括:测量智能体在不同垂直领域(如法律服务)间的泛化能力;利用 Nemotron 等开放模型进行工程优化和微调,构建成本效益高的子智能体;以及建立评估和模拟环境,帮助团队将追踪数据转化为可用于改进智能体的实用数据。

LangChain 表示,其开源生态系统一直是构建者相互学习的重要基础,LangChain Labs 将继续秉承这一传统,持续发布研究、评估和开源集成,助力更广泛的智能体构建社区。

“我们期待与探索智能体学习、适应和改进的团队合作,推动更开放的下一代自我改进型智能体研究。迫不及待与社区分享我们的成果,并持续共同建设。”