AI News HubLIVE
站内改写

Lyft 如何利用 LangGraph 和 LangSmith 構建自助式 AI 代理平台

Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平台,用於客户支持,將代理開發時間從數月縮短至數週。該平台通過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。

文章情報

工程師進階

要點

  • Lyft 通過讓運營團隊、VoC 負責人和產品經理直接使用提示和配置來定義代理,減少了機器學習工程師的介入。
  • 基於路由器的多代理架構使用 LangGraph 協調專業子代理,實現安全檢查和狀態管理。
  • 生產質量依賴於評估、監控和提示紀律,Lyft 使用 LangSmith 進行追蹤和 LLM-as-a-Judge 評估。
  • 結構化提示編寫成為代理可靠性的關鍵因素。

為甚麼重要

這條新聞值得關注,因為Lyft 通過讓運營團隊、VoC 負責人和產品經理直接使用提示和配置來定義代理,減少了機器學習工程師的介入。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Lyft 利用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平台,用於客户支持,顯著加快了代理開發速度。該平台通過路由多代理架構,實現了對乘客和司機請求的智能處理。

在架構方面,系統採用 LangGraph 的路由多代理模式:一個元代理充當有狀態路由器,根據傳入請求分類並分派到專門的子代理。每個子代理都是一個完整的 LangGraph StateGraph,作為子圖節點註冊在元代理中。對於乘客和司機,系統分別運行獨立的路由器實例。當乘客聯繫客服時,元代理路由到乘客意圖子代理;司機則路由到司機意圖子代理。若意圖代理在對話過程中發現需要更專業的代理,它可以通過 Command(goto=..., graph=Command.PARENT) 將控制權交回元代理,元代理再重新路由到合適的專家代理。

子代理遵循一致的節點模式:安全檢測與惡意意圖檢測通過 LangGraph 的 Command(goto=[...]) 並行執行,先於任何 LLM 推理。這種設計既保證了安全性,又實現了模塊化部署——添加新代理只需定義新子圖並註冊到元代理。

Lyft 將代理分為兩類:專業代理(由 MLE 手工構建,處理複雜高風險的工單)和可配置代理(自助服務層)。可配置代理在運行時從 JSON 配置中動態加載,提示從 LangSmith 的 Prompt Hub 中獲取。領域專家按照結構化模板編寫提示,包含角色、範圍、工作流階段和內容指南等五個必需部分。然後,ConfigurableAgent 類處理圖構建、工具綁定、安全門和狀態管理。產品經理可通過編寫提示和 JSON 配置來定義新代理,無需 MLE 代碼變更。

狀態持久化方面,Lyft 構建了自定義的 DynamoDBSaver,實現了 LangGraph 的 BaseCheckpointSaver 接口,為多輪對話提供持久狀態存儲。每個檢查點保存完整的圖狀態、執行元數據和父檢查點引用,支持對話回放和調試。

LangSmith 用於全面追蹤和監控:每個代理調用都被追蹤,捕獲圖執行詳情。通過 LLM-as-a-Judge 評估管道,代理在全面上線前必須通過自動評估。評估指標包括任務完成率、安全違規率、回覆相關性和客户滿意度。此外,每個代理都有生產監控儀表板,跟蹤運行量、錯誤率、延遲、令牌使用和評估分數,並與 PagerDuty 集成實現自動告警。

Lyft 團隊發現,最大的瓶頸不是基礎設施,而是提示質量。領域專家雖然瞭解問題類型,但難以將知識轉化為 LLM 可靠遵循的指令。為此,Lyft 開發了結構化提示編寫框架和自動提示驗證管線,確保每個提示在生產前通過審查。這包括五部分模板和審查清單,以及基於 Git 的提示檢查流程。

通過這一平台,Lyft 將代理開發週期從數月縮短至數週,同時保持了高標準的質量和安全。