模型可互换,本体论复合
Databricks的Genie Ontology强调了本体论在企业AI中的重要性,通过受治理的语义基础层和持续学习的企业上下文图,结合OntoRank算法解决语义歧义,标志着从RAG到本体论的转变。
Databricks最近推出的Genie Ontology引起了业界的广泛关注。其核心理念在于:模型本身可以替换,但本体论才是真正具有持久价值的核心资产。这一观点由Databricks CEO Ali Ghodsi提出,他将Genie Ontology称为“秘密武器”,标志着AI行业从模型中心转向治理上下文中心。本文深入剖析了这一概念及其对企业AI发展的深远影响。
Genie Ontology由两个相互作用的层组成。第一层是受治理的语义基础,由人类定义和策展,包括业务术语表、域和度量。这一层确保了AI系统能够基于一致的定义进行推理,避免了因“收入”等术语在不同部门含义不同而导致的混乱。第二层是机器学习的企业上下文图,它利用数据沿袭、查询历史、仪表板、管道和交互模式,持续构建企业运营的动态表示。系统不仅关注模式,还关注使用模式,从而理解哪些数据实际被信任和使用。
为了解决企业中常见的语义歧义问题,Databricks引入了OntoRank算法。该算法借鉴了PageRank的思想,通过分析定义的来源、作者、使用频率、与认证资产的关联度以及更新时效性,对不同的业务定义进行排名。这使得系统能够自动识别最权威的定义,而无需人工干预所有细节。如果成功,这种可扩展的方法将解决企业语义歧义;如果失败,则可能只是一个更优美的元数据图。
值得注意的是,Genie Ontology超越了传统RAG(检索增强生成)方法。RAG仅在查询时检索文本片段,而本体论则持续维护一个受治理的知识图。这使得AI代理能够直接定位到受信任的数据和指标,而不是在嘈杂的检索结果中自行判断。本体论预先投入工作,而不是在查询时才临时拼凑。
与Anthropic内部构建的分析上下文层相比,Databricks的路径更加侧重于将使用历史转化为权威信号。Anthropic发现原始查询历史过于嘈杂,需要经过提炼才能使用;而Databricks则认为,通过治理和排名,使用历史可以成为可靠的上下文来源。这两种思路本质上互补,但Genie Ontology的OntoRank是该领域最具雄心的尝试,试图将行为数据转化为可信的语义信号。
总而言之,Genie Ontology代表了企业AI基础设施的一个重要转向:从依赖模型能力转向构建持久的、受治理的业务上下文。这种上下文将成为企业AI应用的真正壁垒,而模型只是可替换的部件。未来的AI产品将围绕治理上下文构建,而不是模型本身。