為AI解鎖語義:梅賽德斯-奔馳韓國如何大規模構建可信的“與數據對話”
梅賽德斯-奔馳韓國在Databricks平台上構建了統一的語義層,將500多個KPI定義從Power BI遷移到Unity Catalog,利用Genie和Agent Bricks實現AI與BI的一致語義,並通過自動化DAX到指標視圖的轉換器加速遷移,為其他市場提供了參考。
梅賽德斯-奔馳韓國(Mercedes-Benz Korea)與Databricks合作,構建了一套名為“與數據對話”(Talk to Data)的語義層系統,旨在為AI和BI提供一致的、可信的KPI定義。該系統基於Databricks Data Intelligence平台,利用Unity Catalog、Genie和Agent Bricks等組件,實現了從傳統BI報告到AI驅動自助分析的演進。
背景與願景
作為高端豪華汽車市場的領導者,梅賽德斯-奔馳在全球擁有廣泛的銷售網絡,數據驅動的市場特定決策至關重要。梅賽德斯-奔馳韓國已建立成熟的數據基礎,包括黃金層報告數據、主KPI目錄以及Databricks上Unity Catalog中的共享定義,覆蓋銷售、產品、營銷、客户服務和財務等領域的500多個KPI。這些基礎成為BI報告、自動化和其他數據產品的單一事實來源。然而,大量業務語義定義在Power BI中,為AI使用案例,需要補充一個開放的、AI就緒的語義層。
梅賽德斯-奔馳韓國的願景是建立一個統一的、AI就緒且受治理的語義基礎,支持報告、自助分析和AI體驗,確保所有決策基於一致的業務定義。他們並未將“與數據對話”視為從Power BI的遷移,而是追求三個關鍵目標:為AI提供一致的上下文、架構向代理AI演進、以及從報告用户轉向基於角色的代理。
統一架構
解決方案依賴於Databricks不同組件的協同工作:
- Lakeflow和Lakehouse:從各種源系統攝取企業數據,為BI和AI工作負載準備數據。
- Unity Catalog業務語義:作為KPI的單一事實來源,將Power BI DAX度量轉換為指標視圖,包括源、連接、度量、維度、註釋和同義詞,並與數據共存,受相同權限治理。
- Genie空間:允許業務團隊與數據“對話”,按業務領域組織,每個空間由一組精選指標視圖支持。由於指標視圖直接定義在黃金層數據之上,Genie無需猜測或複雜連接即可得出正確答案,提高了速度和準確性。
- Agent Bricks:在多個Genie空間之上組合基於角色的代理,使CFO、銷售副總裁和營銷負責人各自獲得為其角色定製的“與數據對話”體驗。
- Databricks Apps:提供自定義前端、外部服務連接和其他擴展能力。
自動DAX到指標視圖轉換器
為實現Power BI DAX到Unity Catalog指標視圖的高效標準化遷移,Databricks為梅賽德斯-奔馳韓國構建了一個自動轉換器。該轉換器作為管道運行:解析Power BI語義模型並提取每個DAX度量,創建元數據目錄,將源表映射到Unity Catalog中的對應表,生成指標視圖定義草案,並標記無法自動轉換的度量以供人工審查。轉換器最終輸出評估報告,包含轉換統計、差距和補救策略。這為可自動轉換的DAX度量提供了即用指標視圖,節省了數百小時的手動工作。
構建可信的AI就緒語義
答案質量是業務用户的首要關注點。將KPI作為指標視圖接入Genie空間只是第一步,確保Genie響應與Power BI報告完全一致(100%匹配)是內部目標。在試點期間,梅賽德斯-奔馳韓國與Databricks共同記錄了最佳實踐,包括使用代理元數據和基準測試。
迭代五階段流程:
- 準備:選擇要接入的KPI,並將其映射到Unity Catalog中的源表。對於Power BI語義遷移,識別相關DAX度量和語義模型。
- 構建語義層:創建指標視圖,包含數據源、維度、度量、註釋和代理元數據。逐個驗證每個KPI。對於跨多個事實表的KPI,先構建基礎視圖。
- 按領域組織:按業務領域(如“營銷”)組織Genie空間,按子域內的KPI組組織指標視圖。每個Genie空間限制為30個Unity Catalog項,幷包含空間描述以便多代理系統正確路由問題。
- 增量測試:逐步接入度量,並與Power BI報告對比驗證。
- 迭代優化:根據測試結果調整指標視圖定義,利用Genie Code進行優化。
總結
梅賽德斯-奔馳韓國的“與數據對話”項目展示瞭如何通過統一的語義層賦能AI和BI,確保答案的一致性和可靠性。其經驗有望成為其他梅賽德斯-奔馳市場的參考,推動自助分析在銷售、產品、財務和營銷團隊中的普及。