AI News HubLIVE
站内改写

Data Formulator 0.7:面向企业数据的AI驱动分析工具

Data Formulator 0.7 是一款开源AI系统,旨在解决企业数据分析中数据连接碎片化、分析工作流迭代困难等问题。它提供数据连接器、上下文感知代理和交互式工作区,帮助用户无需编程即可探索、分析和可视化数据。

文章情报

工程师进阶

要点

  • 开源AI系统,专为企业数据分析设计
  • 数据连接器支持多种数据源,减少集成工作
  • 上下文感知代理可辅助数据准备、探索和可视化
  • 交互式工作区支持迭代分析和报告生成

为什么重要

这条新闻值得关注,因为开源AI系统,专为企业数据分析设计。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

企业团队越来越依赖AI系统进行数据分析,但企业数据工作流常常因存储系统和工具的碎片化而受阻。在分析开始之前,团队通常需要建立受控连接、准备元数据、管理权限,并构建跨多个系统的数据组合和重塑工作流。

除了数据连接,分析本身对分析师和领域专家而言仍具挑战性,许多人缺乏深度编程技能。他们经常需要计算新指标、比较不同的数据组织方式、检查中间结果,并根据需求变化优化可视化。这些工作流难以在孤立聊天交互中重现,因为缺乏对企业数据、工作流历史和可视化上下文的持久访问。

微软研究院发布的全新Data Formulator 0.7旨在应对这些挑战。它是一个开源AI驱动数据分析系统,可连接碎片化的企业数据和迭代分析工作流。该系统提供轻量级跨数据源连接方式、可辅助数据准备、探索和可视化的上下文感知代理,以及用户可迭代优化和共享分析的交互式工作区。

**数据连接器连接企业数据** Data Formulator帮助团队将企业数据引入AI就绪工作区,无需为每个数据源重建相同连接。数据连接器功能支持身份验证、持久连接、预览、元数据,并在数据库、数据仓库、BI系统、对象存储和本地文件之间提供统一工作区模型。这减少了平台团队的集成工作,允许用户从集中管理、可重用的数据连接开始工作,而非依赖重复的手动文件上传。

**上下文感知代理助力数据分析** 上下文感知AI代理构成了Data Formulator的核心。与单一提示不同,Data Formulator赋予代理对整个分析工作区的访问权限,包括已连接的数据源、加载的表、之前的图表以及用户目标。代理通过工具而非纯文本进行推理和行动。在单次交互中,代理可以检查数据、在隔离环境中编写并运行代码、生成图表规范,并展示中间步骤来解释结果。当请求不明确时,代理会在继续前提出澄清问题。这使得代理能够执行更复杂的分析工作流:使分析与用户目标对齐、准备和转换数据、提出后续问题、批量生成表格和图表,并为每个结果生成可验证、可复现的代码。

**迭代数据分析工作区** Data Formulator将这些代理与专为开放式分析工作流设计的多模态界面相结合。用户通过数据线程(Data Thread)与代理协作,这是一个结构化聊天,记录整个分析过程中的每个问题、中间发现和图表。长时间会话保持可导航性:用户可以回溯早期步骤,分支到替代分析,并在不丢失上下文的情况下并排比较。交互式画布补充了数据线程,允许用户直接编辑可视化。当用户从探索转向沟通时,他们可以直接在画布上优化图表,或用自然语言描述更改,让代理调整标签、注释、布局、颜色和重点。分析师还可以生成报告并与他人分享发现。

欲了解更多,请访问Data Formulator演示页或GitHub仓库。开发企业数据分析工作流的团队可将该项目作为基础,根据自身系统需求适配这些功能。