AI News HubLIVE
站内改写2 分钟阅读

Rippling如何在6个月内借助Deep Agents和LangSmith实现全产品AI化

Rippling利用LangChain的Deep Agents和LangSmith,在6个月内为其跨HR、IT、财务、薪资和全球运营的平台构建了生产级AI系统,采用多智能体架构和上下文工程解决大规模本体推理难题。

Rippling是一个统一的人力资源、IT、财务、薪资和全球运营管理平台。其数据模型包含数千张表和数十万个字段,跨领域的实体名称重叠,使得构建能够跨领域推理的AI层成为巨大挑战。传统的方法——将schema片段传递给LLM——无法应对这种复杂性。

Rippling AI团队选择了LangChain的Deep Agents和LangSmith作为核心技术栈,在6个月内将AI集成到所有产品中。核心架构是一个多智能体系统:一个监督智能体(supervisor agent)协调5到7个专业子智能体。这些子智能体分为三类:读取智能体(Read agents)用于查询结构化数据(如HR、薪资、IT、财务及Salesforce、Carta、GitHub等连接平台);RAG智能体用于从非结构化来源(如帮助中心文档、公司手册、HR政策文件)检索信息;操作智能体(Action agents)则执行写入操作(如上传奖金、规范化职位名称、触发新员工入职流程等)。

上下文工程是最大的技术挑战。团队开发了三个关键模式:动态技能注入,通过搜索步骤识别相关领域,然后注入仅针对该领域的技能,并结合重排序器将上下文大小缩减100到500倍;可执行代码用于写入操作,将LLM的“做什么”与“如何格式化”分离,通过沙盒代码执行确保数据规范化可靠且可审计;变量引脚(Variable pinning)则通过一个REPL维护运行时变量存储,避免LLM在处理长字母数字ID时产生幻觉。

LangSmith在可观测性和评估中发挥了核心作用。团队构建了分层评估系统:离线评估(每次提交时运行的预录mock和fixture)、合并后集成评估(300-400个查询对完整Rippling沙箱进行实时API调用)、部署阻塞评估(约10个关键场景)以及持续评估(每天多次针对生产数据运行)。此外,半自动自愈循环从LangSmith提取失败的生产追踪,由智能体分析失败原因、提出修复方案、重新运行评估直至回归关闭,最后人工审核并合并PR。

目前,全球超过100万人使用Rippling AI。每条对话流都经过LangSmith,形成持续的质量追踪、用户反馈和改进循环。团队的建议是:构建LLM已经熟悉的系统,将智能体视为同事,为其提供最佳工具(如代码执行、SQL编写),并建立紧密的自调试循环。