Data Formulator 0.7:面向企業數據的AI驅動分析工具
Data Formulator 0.7 是一款開源AI系統,旨在解決企業數據分析中數據連接碎片化、分析工作流迭代困難等問題。它提供數據連接器、上下文感知代理和交互式工作區,幫助用户無需編程即可探索、分析和可視化數據。
文章情報
要點
- 開源AI系統,專為企業數據分析設計
- 數據連接器支持多種數據源,減少集成工作
- 上下文感知代理可輔助數據準備、探索和可視化
- 交互式工作區支持迭代分析和報告生成
為甚麼重要
這條新聞值得關注,因為開源AI系統,專為企業數據分析設計。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
企業團隊越來越依賴AI系統進行數據分析,但企業數據工作流常常因存儲系統和工具的碎片化而受阻。在分析開始之前,團隊通常需要建立受控連接、準備元數據、管理權限,並構建跨多個系統的數據組合和重塑工作流。
除了數據連接,分析本身對分析師和領域專家而言仍具挑戰性,許多人缺乏深度編程技能。他們經常需要計算新指標、比較不同的數據組織方式、檢查中間結果,並根據需求變化優化可視化。這些工作流難以在孤立聊天交互中重現,因為缺乏對企業數據、工作流歷史和可視化上下文的持久訪問。
微軟研究院發佈的全新Data Formulator 0.7旨在應對這些挑戰。它是一個開源AI驅動數據分析系統,可連接碎片化的企業數據和迭代分析工作流。該系統提供輕量級跨數據源連接方式、可輔助數據準備、探索和可視化的上下文感知代理,以及用户可迭代優化和共享分析的交互式工作區。
**數據連接器連接企業數據** Data Formulator幫助團隊將企業數據引入AI就緒工作區,無需為每個數據源重建相同連接。數據連接器功能支持身份驗證、持久連接、預覽、元數據,並在數據庫、數據倉庫、BI系統、對象存儲和本地文件之間提供統一工作區模型。這減少了平台團隊的集成工作,允許用户從集中管理、可重用的數據連接開始工作,而非依賴重複的手動文件上傳。
**上下文感知代理助力數據分析** 上下文感知AI代理構成了Data Formulator的核心。與單一提示不同,Data Formulator賦予代理對整個分析工作區的訪問權限,包括已連接的數據源、加載的表、之前的圖表以及用户目標。代理通過工具而非純文本進行推理和行動。在單次交互中,代理可以檢查數據、在隔離環境中編寫並運行代碼、生成圖表規範,並展示中間步驟來解釋結果。當請求不明確時,代理會在繼續前提出澄清問題。這使得代理能夠執行更復雜的分析工作流:使分析與用户目標對齊、準備和轉換數據、提出後續問題、批量生成表格和圖表,併為每個結果生成可驗證、可復現的代碼。
**迭代數據分析工作區** Data Formulator將這些代理與專為開放式分析工作流設計的多模態界面相結合。用户通過數據線程(Data Thread)與代理協作,這是一個結構化聊天,記錄整個分析過程中的每個問題、中間發現和圖表。長時間會話保持可導航性:用户可以回溯早期步驟,分支到替代分析,並在不丟失上下文的情況下並排比較。交互式畫布補充了數據線程,允許用户直接編輯可視化。當用户從探索轉向溝通時,他們可以直接在畫布上優化圖表,或用自然語言描述更改,讓代理調整標籤、註釋、佈局、顏色和重點。分析師還可以生成報告並與他人分享發現。
欲瞭解更多,請訪問Data Formulator演示頁或GitHub倉庫。開發企業數據分析工作流的團隊可將該項目作為基礎,根據自身系統需求適配這些功能。