Databricks 欲合并企业运行的两大数据库
Databricks 在数据+AI峰会上推出LTAP架构,旨在消除事务处理与分析系统之间的隔阂,为AI智能体重建数据基础设施。
Databricks 正致力于消除企业运营数据库与分析系统之间的界限。在旧金山举行的数据+AI峰会上,该公司发布了名为“湖事务/分析处理”(LTAP)的新架构,旨在为AI智能体重构数据堆栈。
LTAP 的设计基于公司此前收购的 Neon 和 Mooncake Labs 技术。Databricks 首席执行长 Ali Ghodsi 表示:“几十年来,复杂的数据基础设施一直是团队的负担。智能体出现后,组织在数月内有效翻倍了劳动力,但基础设施却成了瓶颈。LTAP 移除了这一瓶颈。”
传统上,企业需同时运行在线事务处理(OLTP)和在线分析处理(OLAP)两种数据库,前者用于实时业务操作,后者用于报告与分析,两者通过 ETL 管道桥接。Databricks 认为,AI 智能体需要整合的系统,既能读取实时事务数据,又能推理历史上下文并立即行动。
LTAP 将事务和分析数据统一在单一存储层中,以开放格式存储在云对象存储上,同时为两类工作负载保留独立计算引擎。其基础是 Databricks 于 2025 年 6 月推出的 Lakebase 操作数据库。现在,Lakebase 新增了对关键业务工作负载的支持,包括原生向量和全文搜索、通过 Zerobus 的实时事件摄入,以及类似 Git 的分支功能,让智能体可以快速复制数据库进行实验。
另一半架构是湖库//RT(Lakehouse//RT),一个由名为 Reyden 的向量化引擎驱动的实时分析引擎,直接运行在湖仓中的 Delta 和 Iceberg 表上,无需额外的服务层。Databricks 称其可实现毫秒级延迟,无需数据复制或管道。
此外,Databricks 还推出了 Unity AI Gateway 用于控制模型和智能体的成本与访问、Genie One 通用智能体、OpenSharing 数据共享协议、面向营销团队的 CustomerLake,以及收购安全公司 Panther。Ghodsi 认为,数据层是 Databricks 真正的护城河,而行业专用产品如 CustomerLake 可进一步巩固其地位。