模型可互換,本體論複合
Databricks的Genie Ontology強調了本體論在企業AI中的重要性,通過受治理的語義基礎層和持續學習的企業上下文圖,結合OntoRank算法解決語義歧義,標誌着從RAG到本體論的轉變。
Databricks最近推出的Genie Ontology引起了業界的廣泛關注。其核心理念在於:模型本身可以替換,但本體論才是真正具有持久價值的核心資產。這一觀點由Databricks CEO Ali Ghodsi提出,他將Genie Ontology稱為“秘密武器”,標誌着AI行業從模型中心轉向治理上下文中心。本文深入剖析了這一概念及其對企業AI發展的深遠影響。
Genie Ontology由兩個相互作用的層組成。第一層是受治理的語義基礎,由人類定義和策展,包括業務術語表、域和度量。這一層確保了AI系統能夠基於一致的定義進行推理,避免了因“收入”等術語在不同部門含義不同而導致的混亂。第二層是機器學習的企業上下文圖,它利用數據沿襲、查詢歷史、儀表板、管道和交互模式,持續構建企業運營的動態表示。系統不僅關注模式,還關注使用模式,從而理解哪些數據實際被信任和使用。
為了解決企業中常見的語義歧義問題,Databricks引入了OntoRank算法。該算法借鑑了PageRank的思想,通過分析定義的來源、作者、使用頻率、與認證資產的關聯度以及更新時效性,對不同的業務定義進行排名。這使得系統能夠自動識別最權威的定義,而無需人工干預所有細節。如果成功,這種可擴展的方法將解決企業語義歧義;如果失敗,則可能只是一個更優美的元數據圖。
值得注意的是,Genie Ontology超越了傳統RAG(檢索增強生成)方法。RAG僅在查詢時檢索文本片段,而本體論則持續維護一個受治理的知識圖。這使得AI代理能夠直接定位到受信任的數據和指標,而不是在嘈雜的檢索結果中自行判斷。本體論預先投入工作,而不是在查詢時才臨時拼湊。
與Anthropic內部構建的分析上下文層相比,Databricks的路徑更加側重於將使用歷史轉化為權威信號。Anthropic發現原始查詢歷史過於嘈雜,需要經過提煉才能使用;而Databricks則認為,通過治理和排名,使用歷史可以成為可靠的上下文來源。這兩種思路本質上互補,但Genie Ontology的OntoRank是該領域最具雄心的嘗試,試圖將行為數據轉化為可信的語義信號。
總而言之,Genie Ontology代表了企業AI基礎設施的一個重要轉向:從依賴模型能力轉向構建持久的、受治理的業務上下文。這種上下文將成為企業AI應用的真正壁壘,而模型只是可替換的部件。未來的AI產品將圍繞治理上下文構建,而不是模型本身。