AI News HubLIVE
站内改写2 分鐘閱讀

隆重推出OpenSharing:代理時代Delta Sharing的下一次進化

Databricks推出OpenSharing,這是Delta Sharing的下一次進化,也是業界首個為代理時代構建的開放協議。它將開放數據共享擴展到完整的AI堆棧,支持模型和代理,併成為Linux基金會下的獨立開源項目。OpenSharing支持跨任何雲、供應商和格式的無縫共享,解決了跨組織數據共享的難題,並引入了Genie Agent Sharing、SecureConnect和Global Distribution等新功能。

Databricks今天宣佈了OpenSharing,這是Delta Sharing的下一次進化,也是業界首個為代理時代構建的開放協議。自2021年Delta Sharing推出以來,它已成為最廣泛採用的開放零拷貝數據共享協議,擁有超過28,000個數據接收方,33%的共享通過開放連接器跨平台流動。然而,隨着代理式AI的崛起,企業需要共享的內容已經發生根本變化——不僅僅是表格和文件,還包括語義上下文、AI技能、非結構化數據和自主代理。

OpenSharing將Delta Sharing提升為一個獨立的開源項目(由Linux基金會託管),並將其範圍從數據共享擴展到完整的AI堆棧:模型、代理,且能夠跨越任何雲、任何供應商和任何格式。這意味着組織現在可以共享治理的AI體驗(如Genie Agent),而不僅僅是數據集。Genie Agent Sharing允許提供商共享包含語義上下文、業務指標和可重用AI邏輯的Genie Agent,並通過Unity Catalog進行端到端治理。提供商還可以控制接收方如何訪問數據,包括隱藏專有指令、限制數據訪問權限、設置每日提示配額和行導出限制,從而開啓基於使用量的定價等新的貨幣化機會。

在跨雲網絡方面,OpenSharing引入了SecureConnect和Global Distribution。SecureConnect是一個Databricks管理的代理,用於路由所有接收方的存儲訪問權限,只需配置一次即可,無需為每個接收方更改防火牆設置。Global Distribution通過自動跨區域和跨雲複製,使接收方可以查詢本地副本,從而消除出口費用並提供低延遲訪問。

OpenSharing還致力於真正的開放性:它支持Delta Lake、Apache Iceberg和Parquet等格式,並通過Databricks存儲生態系統將治理擴展到本地、私有云和邊緣環境。存儲合作伙伴可以實施OpenSharing服務器,將數據資產連接到Unity Catalog而無需移動數據。此外,OpenSharing現在支持Apache Iceberg REST Catalog API,使得與任何Iceberg兼容客户端的共享成為可能。

工作原理上,數據提供者在Unity Catalog中創建共享,定義要共享的數據集、模型、代理或Genie Agent,並設置細粒度的訪問權限。接收方通過現有工具、雲或Iceberg客户端直接查詢共享,無需在Databricks上。Unity Catalog端到端執行治理,審計所有訪問,並確保合規策略隨每個共享資產一起傳遞。數據始終保持在提供者的雲存儲中,接收方查詢實時數據,確保單一事實來源。對於企業部署,SecureConnect和Global Distribution可自動處理跨雲網絡和複製。

OpenSharing代表了從封閉式數據共享向開放AI協作的範式轉變。Databricks聯合創始人兼CTO Matei Zaharia表示:“Delta Sharing證明了行業會選擇開放而非鎖定。OpenSharing將該原則擴展到整個AI堆棧,同時將跨平台生態系統擴展到Iceberg接收方和本地提供商。代理時代值得一個開放的基礎。”