2026-06-02 00:05 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Rippling如何在6個月內藉助Deep Agents和LangSmith實現全產品AI化

Rippling利用LangChain的Deep Agents和LangSmith，在6個月內為其跨HR、IT、財務、薪資和全球運營的平台構建了生產級AI系統，採用多智能體架構和上下文工程解決大規模本體推理難題。

Rippling是一個統一的人力資源、IT、財務、薪資和全球運營管理平台。其數據模型包含數千張表和數十萬個字段，跨領域的實體名稱重疊，使得構建能夠跨領域推理的AI層成為巨大挑戰。傳統的方法——將schema片段傳遞給LLM——無法應對這種複雜性。

Rippling AI團隊選擇了LangChain的Deep Agents和LangSmith作為核心技術棧，在6個月內將AI集成到所有產品中。核心架構是一個多智能體系統：一個監督智能體（supervisor agent）協調5到7個專業子智能體。這些子智能體分為三類：讀取智能體（Read agents）用於查詢結構化數據（如HR、薪資、IT、財務及Salesforce、Carta、GitHub等連接平台）；RAG智能體用於從非結構化來源（如幫助中心文檔、公司手冊、HR政策文件）檢索信息；操作智能體（Action agents）則執行寫入操作（如上傳獎金、規範化職位名稱、觸發新員工入職流程等）。

上下文工程是最大的技術挑戰。團隊開發了三個關鍵模式：動態技能注入，通過搜索步驟識別相關領域，然後注入僅針對該領域的技能，並結合重排序器將上下文大小縮減100到500倍；可執行代碼用於寫入操作，將LLM的“做什麼”與“如何格式化”分離，通過沙盒代碼執行確保數據規範化可靠且可審計；變量引腳（Variable pinning）則通過一個REPL維護運行時變量存儲，避免LLM在處理長字母數字ID時產生幻覺。

LangSmith在可觀測性和評估中發揮了核心作用。團隊構建了分層評估系統：離線評估（每次提交時運行的預錄mock和fixture）、合併後集成評估（300-400個查詢對完整Rippling沙箱進行實時API調用）、部署阻塞評估（約10個關鍵場景）以及持續評估（每天多次針對生產數據運行）。此外，半自動自愈循環從LangSmith提取失敗的生產追蹤，由智能體分析失敗原因、提出修復方案、重新運行評估直至迴歸關閉，最後人工審核併合並PR。

目前，全球超過100萬人使用Rippling AI。每條對話流都經過LangSmith，形成持續的質量追蹤、用户反饋和改進循環。團隊的建議是：構建LLM已經熟悉的系統，將智能體視為同事，為其提供最佳工具（如代碼執行、SQL編寫），並建立緊密的自調試循環。