2026-06-02 00:05 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

Rippling如何在6个月内借助Deep Agents和LangSmith实现全产品AI化

Rippling利用LangChain的Deep Agents和LangSmith，在6个月内为其跨HR、IT、财务、薪资和全球运营的平台构建了生产级AI系统，采用多智能体架构和上下文工程解决大规模本体推理难题。

Rippling是一个统一的人力资源、IT、财务、薪资和全球运营管理平台。其数据模型包含数千张表和数十万个字段，跨领域的实体名称重叠，使得构建能够跨领域推理的AI层成为巨大挑战。传统的方法——将schema片段传递给LLM——无法应对这种复杂性。

Rippling AI团队选择了LangChain的Deep Agents和LangSmith作为核心技术栈，在6个月内将AI集成到所有产品中。核心架构是一个多智能体系统：一个监督智能体（supervisor agent）协调5到7个专业子智能体。这些子智能体分为三类：读取智能体（Read agents）用于查询结构化数据（如HR、薪资、IT、财务及Salesforce、Carta、GitHub等连接平台）；RAG智能体用于从非结构化来源（如帮助中心文档、公司手册、HR政策文件）检索信息；操作智能体（Action agents）则执行写入操作（如上传奖金、规范化职位名称、触发新员工入职流程等）。

上下文工程是最大的技术挑战。团队开发了三个关键模式：动态技能注入，通过搜索步骤识别相关领域，然后注入仅针对该领域的技能，并结合重排序器将上下文大小缩减100到500倍；可执行代码用于写入操作，将LLM的“做什么”与“如何格式化”分离，通过沙盒代码执行确保数据规范化可靠且可审计；变量引脚（Variable pinning）则通过一个REPL维护运行时变量存储，避免LLM在处理长字母数字ID时产生幻觉。

LangSmith在可观测性和评估中发挥了核心作用。团队构建了分层评估系统：离线评估（每次提交时运行的预录mock和fixture）、合并后集成评估（300-400个查询对完整Rippling沙箱进行实时API调用）、部署阻塞评估（约10个关键场景）以及持续评估（每天多次针对生产数据运行）。此外，半自动自愈循环从LangSmith提取失败的生产追踪，由智能体分析失败原因、提出修复方案、重新运行评估直至回归关闭，最后人工审核并合并PR。

目前，全球超过100万人使用Rippling AI。每条对话流都经过LangSmith，形成持续的质量追踪、用户反馈和改进循环。团队的建议是：构建LLM已经熟悉的系统，将智能体视为同事，为其提供最佳工具（如代码执行、SQL编写），并建立紧密的自调试循环。