AI News HubLIVE
站内改写1 分鐘閱讀

ProfiLLM:面向工業網約車排程的效用對齊智慧使用者畫像

ProfiLLM 是一個智慧LLM資料管道,用於為網約車排程建立效用對齊的使用者畫像。它透過工具增強的全域性知識挖掘和效用對齊的畫像探索克服了擴充套件挑戰。在滴滴上部署後,它在預測AUC、GMV和完成率方面取得了顯著提升。

來源arXiv AI作者: Tengfei Lyu, Zirui Yuan, Xu Liu, Kai Wan, Zihao Lu, Li Ma, Hao Liu

將大語言模型(LLM)引入工業網約車排程系統,作為平臺級行為日誌的語義特徵提取器,是一個引人注目但尚未充分探索的資料系統問題。目前,生產環境的匹配流水線仍然以結構化數值特徵為主,然而,關鍵的行為訊號(例如,駕駛員對某些區域的習慣性迴避)本質上是上下文相關的,並且可以自然地表示為 LLM 生成的使用者畫像。然而,將這種畫像擴充套件到具有毫秒級延遲的即時排程器面臨著三種相互交織的限制,這些限制很少被同時解決:在擁有數百萬日訂單的平臺上,日誌量遠遠超出任何 LLM 的上下文視窗;大多數使用者是長尾使用者,互動次數太少,無法進行每個使用者的畫像分析;而且表面流暢的畫像不一定能提高下游預測的實用性。

為此,我們提出了 ProfiLLM,一個智慧 LLM 資料管道,透過兩個模組實現了面向生產匹配系統的效用對齊使用者畫像。第一模組是工具增強的全域性知識挖掘,為 LLM 智慧體配備 27 種分析工具,用於挖掘平臺級資料,生產可重用的全域性知識、自適應使用者聚類規則以及區域級供需先驗。第二模組是效用對齊的畫像探索,為每個聚類生成多個候選畫像,透過輕量級下游效用代理進行評估,迭代最佳化最佳候選,並構建偏好對用於 DPO 微調。

ProfiLLM 已部署在滴滴的生產排程器上,在結果預測中實現了高達 +6.14% 的相對 AUC 改進,在排程模擬中實現了高達 +4.35% 的 GMV 增長,並在為期 14 天的線上 A/B 測試中取得了一致改進,包括 GMV 增長 +0.47%、完成率 +0.33% 以及接單前取消率下降 -0.82%。這些結果表明,ProfiLLM 能夠有效地將 LLM 生成的行為畫像用於工業級排程系統,在保持低延遲的同時顯著提升關鍵業務指標。該系統不僅克服了上下文視窗和長尾使用者的限制,還確保了畫像的實用性,為大規模智慧排程提供了新思路。