AI News HubLIVE
站內改寫2 分鐘閱讀

為什麼前沿生態系統必須開放——Databricks的Matei Zaharia和Reynold Xin

在罕見的雙重採訪中,Databricks技術領袖探討了每家公司構建代理雲所需的條件,包括Omnigent元框架、LTAP資料庫架構以及企業代理的作業系統願景。

在2026年Data + AI Summit上,Databricks的聯合創始人Matei Zaharia和Reynold Xin接受了獨家採訪,深入探討了公司如何從湖倉一體轉型為面向AI代理時代的完整作業系統。兩位技術領袖強調,隨著前沿模型效能逐漸商品化,企業的持久競爭優勢將不再僅僅依賴於模型本身,而是來自圍繞模型的專有資料、受控訪問、運營狀態、事務日誌、工作流和反饋迴圈。這正是Databricks全力押注的方向。

採訪的核心之一是Omnigent——Databricks開源的元框架,旨在解決AI代理面臨的一系列通用問題:可移植性、協作、會話歷史、安全性、成本控制以及跨不同代理平臺(如Claude Code、Codex、Cursor等)的統一管理。Matei解釋了為什麼編碼代理和企業定製代理需要相同的基礎設施:兩者都需要持久會話、雲沙箱、共享、搜尋和協作能力。Omnigent提供了一個通用API來管理會話、檔案、流、工具呼叫和取消操作,使得開發者可以自由地在不同模型和代理框架之間切換,而無需重寫底層邏輯。

另一個重磅釋出是LTAP(延遲-事務-分析-處理),這是Databricks對傳統資料庫堆疊的重新思考。Reynold指出,傳統的OLTP和OLAP分離導致了資料管道的脆弱性(甚至被戲稱為“持續資料損壞”),而HTAP雖然被譽為資料庫工程的聖盃,但在工程實現上極其複雜。LTAP透過統一儲存層(例如Parquet)來避免引擎層面的複雜性,從而獲得HTAP的大部分優勢。這一架構使得AI代理能夠直接訪問即時事務資料,而不是僅依賴事後遙測資料,從而做出更及時、精準的決策。

採訪還深入討論了代理安全的重要性。Matei強調,代理需要上下文感知和狀態化的安全策略,以防止代理意外讀取機密文件、安裝惡意包或洩露資料。同時,支出控制也至關重要——一個失控的代理可能在幾分鐘內消耗500美元來讀取日誌檔案。Databricks透過在Omnigent中內建安全層和成本控制機制來應對這些挑戰。

此外,Reynold和Matei還分享了Databricks在基礎設施規模上的驚人資料:每天執行5000萬到6000萬個虛擬機器,處理艾位元組級別的資料。他們討論了快速原型開發文化,如何從50人的小規模聚會發展到10萬人參與的全球社群。對於傳統軟體的未來,他們大膽預測:一旦資料被正確組織並暴露給AI代理,代理將能夠重寫大部分傳統軟體的工作流——只需“把資料放好,上面加個代理”即可。

最後,他們談到了開源策略的重要性。Omnigent之所以開源,是為了促進整個生態系統的創新和互操作性。Databricks相信,開放格式和協作是保持前沿的關鍵,這也體現了他們與Snowflake等競爭對手的本質區別。採訪還涉及Mosaic模型策略、Genie資料科學代理、AI Runtime、RL微調等眾多技術細節,為AI工程師提供了豐富的實踐洞察。

為什麼前沿生態系統必須開放——Databricks的Matei Zaharia和Reynold Xin | AI News Hub