AI News HubLIVE
站内改写1 分鐘閱讀

Databricks 欲合併企業運行的兩大數據庫

Databricks 在數據+AI峯會上推出LTAP架構,旨在消除事務處理與分析系統之間的隔閡,為AI智能體重建數據基礎設施。

來源The New Stack AI作者: Frederic Lardinois

Databricks 正致力於消除企業運營數據庫與分析系統之間的界限。在舊金山舉行的數據+AI峯會上,該公司發佈了名為“湖事務/分析處理”(LTAP)的新架構,旨在為AI智能體重構數據堆棧。

LTAP 的設計基於公司此前收購的 Neon 和 Mooncake Labs 技術。Databricks 首席執行長 Ali Ghodsi 表示:“幾十年來,複雜的數據基礎設施一直是團隊的負擔。智能體出現後,組織在數月內有效翻倍了勞動力,但基礎設施卻成了瓶頸。LTAP 移除了這一瓶頸。”

傳統上,企業需同時運行在線事務處理(OLTP)和在線分析處理(OLAP)兩種數據庫,前者用於實時業務操作,後者用於報告與分析,兩者通過 ETL 管道橋接。Databricks 認為,AI 智能體需要整合的系統,既能讀取實時事務數據,又能推理歷史上下文並立即行動。

LTAP 將事務和分析數據統一在單一存儲層中,以開放格式存儲在雲對象存儲上,同時為兩類工作負載保留獨立計算引擎。其基礎是 Databricks 於 2025 年 6 月推出的 Lakebase 操作數據庫。現在,Lakebase 新增了對關鍵業務工作負載的支持,包括原生向量和全文搜索、通過 Zerobus 的實時事件攝入,以及類似 Git 的分支功能,讓智能體可以快速複製數據庫進行實驗。

另一半架構是湖庫//RT(Lakehouse//RT),一個由名為 Reyden 的向量化引擎驅動的實時分析引擎,直接運行在湖倉中的 Delta 和 Iceberg 表上,無需額外的服務層。Databricks 稱其可實現毫秒級延遲,無需數據複製或管道。

此外,Databricks 還推出了 Unity AI Gateway 用於控制模型和智能體的成本與訪問、Genie One 通用智能體、OpenSharing 數據共享協議、面向營銷團隊的 CustomerLake,以及收購安全公司 Panther。Ghodsi 認為,數據層是 Databricks 真正的護城河,而行業專用產品如 CustomerLake 可進一步鞏固其地位。