Databricks、企業が運用する2つのデータベースを統合へ
Databricksはデータ+AIサミットでLTAPアーキテクチャを発表し、トランザクション処理と分析システムの乖離を解消、AIエージェント向けにデータ基盤を再構築する。
Databricksは、企業が運用するデータベースと分析システムの間の分断を解消しようとしている。サンフランシスコで開催されたData + AI Summitで、同社は「Lake Transactional/Analytical Processing(LTAP)」と呼ぶアーキテクチャを発表した。これはAIエージェント向けにデータスタックを再構築するものだ。
LTAPは、同社が以前買収したNeonとMooncake Labsの技術に基づいている。Databricksの共同創業者兼CEOであるAli Ghodsi氏は、「何十年もの間、複雑なデータインフラはチームに課せられた税金だった。エージェントの登場により、組織は事実上数ヶ月で労働力を倍増させたが、インフラがボトルネックとなっていた。LTAPはそれを取り除く」と述べた。
従来、企業はオンライントランザクション処理(OLTP)とオンライン分析処理(OLAP)の2種類のデータベースを運用し、ETLパイプラインで橋渡ししていた。Databricksは、AIエージェントには統合されたシステムが必要だと主張する。エージェントはライブのトランザクションデータを読み取り、履歴コンテキストを推論し、即座に行動できる必要があるからだ。
LTAPは、トランザクションデータと分析データを単一のストレージ層に統合し、オープンフォーマットでクラウドオブジェクトストレージに保存する。一方で、各ワークロードに独立した計算エンジンを維持する。基盤となるのは、Databricksが2025年6月に発表したLakebase運用データベースだ。現在、Lakebaseはミッションクリティカルなワークロード向けに拡張され、ネイティブベクトル検索と全文検索、Zerobusによるリアルタイムイベント取り込み、Gitスタイルのブランチ機能を追加している。これにより、エージェントはデータベースを即座にコピーして実験できる。
もう一つの要素はLakehouse//RTだ。Reydenと呼ばれるベクトル化エンジンを搭載したリアルタイム分析エンジンで、レイクハウス内のDeltaおよびIcebergテーブル上で直接動作する。Databricksは、追加のデータコピーやパイプラインなしでミリ秒単位のレイテンシを実現すると述べている。
さらに、DatabricksはUnity AI Gateway(モデル、エージェント、予算の一元管理)、汎用エージェントGenie One、データ共有プロトコルOpenSharing、マーケティング向けCustomerLake、セキュリティ企業Pantherの買収も発表した。Ghodsi氏は、データ層がDatabricksの真の差別化要因であり、CustomerLakeのような業界特化型製品がその地位をさらに強化すると強調した。