Data + AI Summit 2026上Unity Catalog的新功能
在Data + AI Summit 2026上,Databricks宣佈了Unity Catalog的重大更新,包括Unity AI Gateway用於治理AI代理、Glossary和Domains提供業務上下文、以及跨雲和跨區域的治理能力。這些功能旨在滿足代理時代對控制、上下文和選擇的需求。
在Data + AI Summit 2026上,Databricks釋出了Unity Catalog的一系列新功能,旨在應對代理時代對資料治理的更高要求。隨著數十萬AI代理在即時處理企業資料,傳統的訪問控制已不足以滿足需求。Unity Catalog從記錄系統轉變為AI執行時決策者,提供控制、上下文和選擇三大要素。
控制:AI代理治理
Unity AI Gateway是本次釋出的重點,它將治理擴充套件到執行時互動,管理模型、代理、MCP服務、技能和工具。管理員可以註冊和管理所有AI資產,包括外部模型和MCP服務,並透過上下文服務策略(Beta)控制AI在特定互動中的行為,如允許、拒絕或要求批准敏感操作。內建的防護措施可防止PII暴露、提示注入和不安全內容。此外,AI Gateway預算現在覆蓋外部提供商,提供跨提供商支出的統一檢視,並可透過硬性支出上限進行控制。統一的代理跟蹤功能將模型和MCP活動記錄在治理遙測層中,並可在Lakewatch中分析。
治理中心(Governance Hub,Pre-Private Preview)為資料管理員提供了一箇中央指揮中心,用於監控資料資產狀況、識別風險並優先修復,同時擴充套件了資料、AI、成本和效能的治理操作。
基於屬性的訪問控制(ABAC)現已支援行過濾和列掩碼的通用可用性,並新增了ABAC授權策略(模型Beta),可自動對所有匹配模型授予執行許可權。身份屬性和上下文屬性即將預覽,允許使用即時使用者屬性和請求上下文構建訪問規則。標籤傳播功能(Private Preview)可自動將治理標籤從源表傳遞到下游表,保持一致性。
基於角色的訪問控制(RBAC,Public Preview即將推出)允許定義具有許可權集合的角色,使用者可切換角色以實現隔離訪問,適用於臨床研究或國家特定資料等場景。
上下文:開放且自適應的企業上下文
Unity Catalog Semantics擴充套件了業務上下文管理。Glossary(預覽即將推出)允許定義權威概念、術語和分類,並與資料關聯,支援團隊協作和AI驅動的建議。Domains(公開預覽)將資料資產組織為業務對齊的類別,為代理提供範圍化上下文,並支援AI推薦的領域建議。
Metrics功能大幅擴充套件,支援多事實關係、詳細級別計算、引數化指標和視窗度量,並提供了UI和代理驅動的方式建立指標。物化功能(公開預覽)可預計算結果以加速查詢。此外,還支援從Power BI和Tableau匯入模型。Metrics開源並在Apache Spark和Unity Catalog OSS中可用。
外部血緣(通用可用)擴充套件到Databricks之外的資產,支援註冊上游系統和下游BI報表,形成端到端血緣圖。Lakeflow Connect自動記錄從源表到目標表的血緣。
表洞察新增列級流行度訊號,可顯示每列的相對流行度,並饋入Genie Ontology。
選擇:開放的代理時代基礎設施
Unity Catalog透過四級名稱空間(metastore.catalog.schema.table)實現跨賬戶、區域和雲的統一定址,一致治理。託管災難恢復(需Mission Critical附加元件)可在幾分鐘內實現跨區域故障轉移。在格式和平臺互操作性方面,Unity Catalog支援Delta Lake和Apache Iceberg生態,包括Iceberg v3 GA、Managed Iceberg GA、新的聯邦聯結器和跨引擎ABAC。外部訪問託管Delta表(公開預覽即將推出)使得Unity Catalog中的表可透過標準聯結器被其他引擎查詢。此外,Apache Spark上的Unity Catalog OSS將成為Unity Catalog的參考引擎。