AI News HubLIVE
站内改写2 分钟阅读

Data + AI Summit 2026上Unity Catalog的新功能

在Data + AI Summit 2026上,Databricks宣布了Unity Catalog的重大更新,包括Unity AI Gateway用于治理AI代理、Glossary和Domains提供业务上下文、以及跨云和跨区域的治理能力。这些功能旨在满足代理时代对控制、上下文和选择的需求。

在Data + AI Summit 2026上,Databricks发布了Unity Catalog的一系列新功能,旨在应对代理时代对数据治理的更高要求。随着数十万AI代理在实时处理企业数据,传统的访问控制已不足以满足需求。Unity Catalog从记录系统转变为AI运行时决策者,提供控制、上下文和选择三大要素。

控制:AI代理治理

Unity AI Gateway是本次发布的重点,它将治理扩展到运行时交互,管理模型、代理、MCP服务、技能和工具。管理员可以注册和管理所有AI资产,包括外部模型和MCP服务,并通过上下文服务策略(Beta)控制AI在特定交互中的行为,如允许、拒绝或要求批准敏感操作。内置的防护措施可防止PII暴露、提示注入和不安全内容。此外,AI Gateway预算现在覆盖外部提供商,提供跨提供商支出的统一视图,并可通过硬性支出上限进行控制。统一的代理跟踪功能将模型和MCP活动记录在治理遥测层中,并可在Lakewatch中分析。

治理中心(Governance Hub,Pre-Private Preview)为数据管理员提供了一个中央指挥中心,用于监控数据资产状况、识别风险并优先修复,同时扩展了数据、AI、成本和性能的治理操作。

基于属性的访问控制(ABAC)现已支持行过滤和列掩码的通用可用性,并新增了ABAC授权策略(模型Beta),可自动对所有匹配模型授予执行权限。身份属性和上下文属性即将预览,允许使用实时用户属性和请求上下文构建访问规则。标签传播功能(Private Preview)可自动将治理标签从源表传递到下游表,保持一致性。

基于角色的访问控制(RBAC,Public Preview即将推出)允许定义具有权限集合的角色,用户可切换角色以实现隔离访问,适用于临床研究或国家特定数据等场景。

上下文:开放且自适应的企业上下文

Unity Catalog Semantics扩展了业务上下文管理。Glossary(预览即将推出)允许定义权威概念、术语和分类,并与数据关联,支持团队协作和AI驱动的建议。Domains(公开预览)将数据资产组织为业务对齐的类别,为代理提供范围化上下文,并支持AI推荐的领域建议。

Metrics功能大幅扩展,支持多事实关系、详细级别计算、参数化指标和窗口度量,并提供了UI和代理驱动的方式创建指标。物化功能(公开预览)可预计算结果以加速查询。此外,还支持从Power BI和Tableau导入模型。Metrics开源并在Apache Spark和Unity Catalog OSS中可用。

外部血缘(通用可用)扩展到Databricks之外的资产,支持注册上游系统和下游BI报表,形成端到端血缘图。Lakeflow Connect自动记录从源表到目标表的血缘。

表洞察新增列级流行度信号,可显示每列的相对流行度,并馈入Genie Ontology。

选择:开放的代理时代基础设施

Unity Catalog通过四级命名空间(metastore.catalog.schema.table)实现跨账户、区域和云的统一寻址,一致治理。托管灾难恢复(需Mission Critical附加组件)可在几分钟内实现跨区域故障转移。在格式和平台互操作性方面,Unity Catalog支持Delta Lake和Apache Iceberg生态,包括Iceberg v3 GA、Managed Iceberg GA、新的联邦连接器和跨引擎ABAC。外部访问托管Delta表(公开预览即将推出)使得Unity Catalog中的表可通过标准连接器被其他引擎查询。此外,Apache Spark上的Unity Catalog OSS将成为Unity Catalog的参考引擎。