Databricks 欲合併企業執行的兩大數據庫
Databricks 在資料+AI峰會上推出LTAP架構,旨在消除事務處理與分析系統之間的隔閡,為AI智慧體重建資料基礎設施。
Databricks 正致力於消除企業運營資料庫與分析系統之間的界限。在舊金山舉行的資料+AI峰會上,該公司釋出了名為“湖事務/分析處理”(LTAP)的新架構,旨在為AI智慧體重構資料堆疊。
LTAP 的設計基於公司此前收購的 Neon 和 Mooncake Labs 技術。Databricks 首席執行長 Ali Ghodsi 表示:“幾十年來,複雜的資料基礎設施一直是團隊的負擔。智慧體出現後,組織在數月內有效翻倍了勞動力,但基礎設施卻成了瓶頸。LTAP 移除了這一瓶頸。”
傳統上,企業需同時執行線上事務處理(OLTP)和線上分析處理(OLAP)兩種資料庫,前者用於即時業務操作,後者用於報告與分析,兩者透過 ETL 管道橋接。Databricks 認為,AI 智慧體需要整合的系統,既能讀取即時事務資料,又能推理歷史上下文並立即行動。
LTAP 將事務和分析資料統一在單一儲存層中,以開放格式儲存在雲物件儲存上,同時為兩類工作負載保留獨立計算引擎。其基礎是 Databricks 於 2025 年 6 月推出的 Lakebase 運算元據庫。現在,Lakebase 新增了對關鍵業務工作負載的支援,包括原生向量和全文搜尋、透過 Zerobus 的即時事件攝入,以及類似 Git 的分支功能,讓智慧體可以快速複製資料庫進行實驗。
另一半架構是湖庫//RT(Lakehouse//RT),一個由名為 Reyden 的向量化引擎驅動的即時分析引擎,直接執行在湖倉中的 Delta 和 Iceberg 表上,無需額外的服務層。Databricks 稱其可實現毫秒級延遲,無需資料複製或管道。
此外,Databricks 還推出了 Unity AI Gateway 用於控制模型和智慧體的成本與訪問、Genie One 通用智慧體、OpenSharing 資料共享協議、面向營銷團隊的 CustomerLake,以及收購安全公司 Panther。Ghodsi 認為,資料層是 Databricks 真正的護城河,而行業專用產品如 CustomerLake 可進一步鞏固其地位。