AI News HubLIVE
站内改写1 分鐘閱讀

ProfiLLM:面向工業網約車調度的效用對齊智能用户畫像

ProfiLLM 是一個智能LLM數據管道,用於為網約車調度創建效用對齊的用户畫像。它通過工具增強的全局知識挖掘和效用對齊的畫像探索克服了擴展挑戰。在滴滴上部署後,它在預測AUC、GMV和完成率方面取得了顯著提升。

來源arXiv AI作者: Tengfei Lyu, Zirui Yuan, Xu Liu, Kai Wan, Zihao Lu, Li Ma, Hao Liu

將大語言模型(LLM)引入工業網約車調度系統,作為平台級行為日誌的語義特徵提取器,是一個引人注目但尚未充分探索的數據系統問題。目前,生產環境的匹配流水線仍然以結構化數值特徵為主,然而,關鍵的行為信號(例如,駕駛員對某些區域的習慣性迴避)本質上是上下文相關的,並且可以自然地表示為 LLM 生成的用户畫像。然而,將這種畫像擴展到具有毫秒級延遲的實時調度器面臨着三種相互交織的限制,這些限制很少被同時解決:在擁有數百萬日訂單的平台上,日誌量遠遠超出任何 LLM 的上下文窗口;大多數用户是長尾用户,交互次數太少,無法進行每個用户的畫像分析;而且表面流暢的畫像不一定能提高下游預測的實用性。

為此,我們提出了 ProfiLLM,一個智能 LLM 數據管道,通過兩個模塊實現了面向生產匹配系統的效用對齊用户畫像。第一模塊是工具增強的全局知識挖掘,為 LLM 智能體配備 27 種分析工具,用於挖掘平台級數據,生產可重用的全局知識、自適應用户聚類規則以及區域級供需先驗。第二模塊是效用對齊的畫像探索,為每個聚類生成多個候選畫像,通過輕量級下游效用代理進行評估,迭代優化最佳候選,並構建偏好對用於 DPO 微調。

ProfiLLM 已部署在滴滴的生產調度器上,在結果預測中實現了高達 +6.14% 的相對 AUC 改進,在調度模擬中實現了高達 +4.35% 的 GMV 增長,並在為期 14 天的在線 A/B 測試中取得了一致改進,包括 GMV 增長 +0.47%、完成率 +0.33% 以及接單前取消率下降 -0.82%。這些結果表明,ProfiLLM 能夠有效地將 LLM 生成的行為畫像用於工業級調度系統,在保持低延遲的同時顯著提升關鍵業務指標。該系統不僅克服了上下文窗口和長尾用户的限制,還確保了畫像的實用性,為大規模智能調度提供了新思路。