2026-06-20站内改写2 分钟阅读更新: 2026-06-20

模型可互换，本体论复合

Databricks的Genie Ontology强调了本体论在企业AI中的重要性，通过受治理的语义基础层和持续学习的企业上下文图，结合OntoRank算法解决语义歧义，标志着从RAG到本体论的转变。

Databricks最近推出的Genie Ontology引起了业界的广泛关注。其核心理念在于：模型本身可以替换，但本体论才是真正具有持久价值的核心资产。这一观点由Databricks CEO Ali Ghodsi提出，他将Genie Ontology称为“秘密武器”，标志着AI行业从模型中心转向治理上下文中心。本文深入剖析了这一概念及其对企业AI发展的深远影响。

Genie Ontology由两个相互作用的层组成。第一层是受治理的语义基础，由人类定义和策展，包括业务术语表、域和度量。这一层确保了AI系统能够基于一致的定义进行推理，避免了因“收入”等术语在不同部门含义不同而导致的混乱。第二层是机器学习的企业上下文图，它利用数据沿袭、查询历史、仪表板、管道和交互模式，持续构建企业运营的动态表示。系统不仅关注模式，还关注使用模式，从而理解哪些数据实际被信任和使用。

为了解决企业中常见的语义歧义问题，Databricks引入了OntoRank算法。该算法借鉴了PageRank的思想，通过分析定义的来源、作者、使用频率、与认证资产的关联度以及更新时效性，对不同的业务定义进行排名。这使得系统能够自动识别最权威的定义，而无需人工干预所有细节。如果成功，这种可扩展的方法将解决企业语义歧义；如果失败，则可能只是一个更优美的元数据图。

值得注意的是，Genie Ontology超越了传统RAG（检索增强生成）方法。RAG仅在查询时检索文本片段，而本体论则持续维护一个受治理的知识图。这使得AI代理能够直接定位到受信任的数据和指标，而不是在嘈杂的检索结果中自行判断。本体论预先投入工作，而不是在查询时才临时拼凑。

与Anthropic内部构建的分析上下文层相比，Databricks的路径更加侧重于将使用历史转化为权威信号。Anthropic发现原始查询历史过于嘈杂，需要经过提炼才能使用；而Databricks则认为，通过治理和排名，使用历史可以成为可靠的上下文来源。这两种思路本质上互补，但Genie Ontology的OntoRank是该领域最具雄心的尝试，试图将行为数据转化为可信的语义信号。

总而言之，Genie Ontology代表了企业AI基础设施的一个重要转向：从依赖模型能力转向构建持久的、受治理的业务上下文。这种上下文将成为企业AI应用的真正壁垒，而模型只是可替换的部件。未来的AI产品将围绕治理上下文构建，而不是模型本身。