モデルは交換可能、オントロジーは複合する
DatabricksのGenie Ontologyは、企業AIにおけるオントロジーの重要性を強調し、ガバナンスされたセマンティック基盤と機械学習によるエンタープライズコンテキストグラフを組み合わせ、OntoRankで曖昧さを解決し、RAGからオントロジーベースへのシフトを示す。
Databricksが最近発表したGenie Ontologyは、業界の注目を集めている。その中心的な考えは、モデル自体は交換可能だが、オントロジーこそが持続的な価値を生むというものだ。CEOのAli Ghodsiが「秘密のソース」と呼ぶこの技術は、AI産業がモデル中心からガバナンスされたコンテキスト中心へと移行していることを示している。本稿では、この概念と企業AIへの影響を詳しく解説する。
Genie Ontologyは、相互に作用する2つの層から構成される。第一層は、人間が定義・キュレーションするガバナンスされたセマンティック基盤であり、ビジネス用語集、ドメイン、メトリクスを含む。これにより、「収益」などの用語が部門間で異なる意味を持つ問題を解決し、AIが一貫した定義に基づいて推論できるようになる。第二層は、データの系統、クエリ履歴、ダッシュボード、パイプライン、ユーザーインタラクションを活用して継続的に学習・構築されるエンタープライズコンテキストグラフである。この層は、スキーマだけでなく実際の使用状況を分析し、どのデータが信頼されているかを理解する。
セマンティックの曖昧さを解決するために、DatabricksはOntoRankを導入した。これはPageRankに類似し、定義の出典、作成者、使用頻度、認定アセットとの関連性、更新の新しさなどを重み付けしてランク付けする。これにより、システムは人間の介入なしに最も権威ある定義を自動的に選択できる。このアイデアはエレガントであり、成功すれば、企業の意味的曖昧さをスケーラブルに解決できる。失敗すれば、単にノイズの多いメタデータグラフになるリスクもある。
Genie Ontologyは従来のRAG(検索拡張生成)とは根本的に異なる。RAGはクエリ時にのみ断片的なテキストを検索するのに対し、オントロジーはガバナンスされた知識グラフを事前に構築・維持する。そのため、AIエージェントは信頼できるデータや指標を直接参照でき、ノイズの多い検索結果に依存しない。オントロジーはクエリ時だけでなくバックグラウンドで継続的にコンテキストを構築する。
Anthropicが内部で構築した分析コンテキスト層との比較も興味深い。Anthropicは生のクエリ履歴がノイズだらけであり、精錬が必要だと結論付けた。一方、Databricksはガバナンスとランキングによって使用履歴を信頼できる信号に変換できると確信している。両者は対立するものではなく、同じアイデアの異なるバージョンかもしれない。クエリ履歴が有用かどうかではなく、それを信頼できるセマンティック信号に変換できるかが鍵である。Genie OntologyのOntoRankがその変換を実証できれば、大きな前進となる。
結論として、Genie Ontologyは企業AIインフラの重要な転換点を示す。モデルの性能ではなく、持続的かつガバナンスされたビジネスコンテキストこそが、真の競争優位性となる。将来のAI製品は、モデルではなくガバナンスされたコンテキストを中心に構築されるだろう。