2026-06-02 00:05 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Rippling如何在6個月內藉助Deep Agents和LangSmith實現全產品AI化

Rippling利用LangChain的Deep Agents和LangSmith，在6個月內為其跨HR、IT、財務、薪資和全球運營的平臺構建了生產級AI系統，採用多智慧體架構和上下文工程解決大規模本體推理難題。

Rippling是一個統一的人力資源、IT、財務、薪資和全球運營管理平臺。其資料模型包含數千張表和數十萬個欄位，跨領域的實體名稱重疊，使得構建能夠跨領域推理的AI層成為巨大挑戰。傳統的方法——將schema片段傳遞給LLM——無法應對這種複雜性。

Rippling AI團隊選擇了LangChain的Deep Agents和LangSmith作為核心技術棧，在6個月內將AI整合到所有產品中。核心架構是一個多智慧體系統：一個監督智慧體（supervisor agent）協調5到7個專業子智慧體。這些子智慧體分為三類：讀取智慧體（Read agents）用於查詢結構化資料（如HR、薪資、IT、財務及Salesforce、Carta、GitHub等連線平臺）；RAG智慧體用於從非結構化來源（如幫助中心文件、公司手冊、HR政策檔案）檢索資訊；操作智慧體（Action agents）則執行寫入操作（如上傳獎金、規範化職位名稱、觸發新員工入職流程等）。

上下文工程是最大的技術挑戰。團隊開發了三個關鍵模式：動態技能注入，透過搜尋步驟識別相關領域，然後注入僅針對該領域的技能，並結合重排序器將上下文大小縮減100到500倍；可執行程式碼用於寫入操作，將LLM的“做什麼”與“如何格式化”分離，透過沙盒程式碼執行確保資料規範化可靠且可審計；變數引腳（Variable pinning）則透過一個REPL維護執行時變數儲存，避免LLM在處理長字母數字ID時產生幻覺。

LangSmith在可觀測性和評估中發揮了核心作用。團隊構建了分層評估系統：離線評估（每次提交時執行的預錄mock和fixture）、合併後整合評估（300-400個查詢對完整Rippling沙箱進行即時API呼叫）、部署阻塞評估（約10個關鍵場景）以及持續評估（每天多次針對生產資料執行）。此外，半自動自愈迴圈從LangSmith提取失敗的生產追蹤，由智慧體分析失敗原因、提出修復方案、重新執行評估直至迴歸關閉，最後人工稽核併合並PR。

目前，全球超過100萬人使用Rippling AI。每條對話流都經過LangSmith，形成持續的質量追蹤、使用者反饋和改進迴圈。團隊的建議是：構建LLM已經熟悉的系統，將智慧體視為同事，為其提供最佳工具（如程式碼執行、SQL編寫），並建立緊密的自除錯迴圈。