元鉴
返回中文阅读流

Microsoft Research Blog

Data Formulator 0.7:AI驱动的企业数据分析

Data Formulator 为企业数据工作流引入了AI驱动的分析功能。数据团队可轻松将企业数据接入AI就绪型工作区,用户能够借助AI智能体探索、分析并可视化数据,从而将原始数据转化为可落地的洞察。本文《Data Formulator 0.7:AI驱动的企业数据分析》首发于 Microsoft Research。

中文内容

已翻译official company source英文原文2026-05-28
Three minimalist white line icons on a textured blue‑green gradient background: a rising bar chart on the left, a central hub‑and‑spoke network diagram in the middle, and a checkmark inside a circle on the right.

概览

  • Data Formulator 0.7 是一款开源的 AI 驱动型企业数据分析系统,在共享工作区中集成了数据连接、智能体引导的探索与可视化优化功能。
  • 该版本包含 Data Connectors 功能,支持跨数据库、数据仓库、BI 系统、对象存储及本地文件的受管控且可复用连接,从而减轻平台团队的集成工作。
  • 上下文感知智能体可协助用户进行数据准备、分析探索、可视化生成,并引导长周期及分支化的分析工作流。
  • 交互式多模态界面使团队能够在碎片化的数据源之间迭代探索并优化分析结果,全程无需具备 SQL 或编程技能。

企业团队日益依赖 AI 系统进行分析,但企业数据工作流往往分散于各类存储系统与工具中。在启动分析前,团队通常需建立受管控连接、准备元数据、管理权限,并构建跨多系统整合与重塑数据的工作流。

除数据连接外,分析工作本身对分析师与领域专家而言仍具挑战,他们大多缺乏深厚的编程功底。他们常需计算新指标、对比不同的数据组织方式、检查中间输出,并随需求演进不断优化可视化。然而,在缺乏企业数据持久访问权限、工作流历史记录及可视化上下文的孤立对话交互中,此类工作流往往难以复现。

我们此次发布的 Data Formulator 0.7(在新标签页中打开) 旨在应对上述挑战。这是一款开源的 AI 驱动数据分析系统,能够串联碎片化的企业数据与迭代式分析工作流。它提供轻量化的跨多数据源连接方案、协助数据准备、探索与可视化的上下文感知智能体,以及支持用户迭代优化并共享分析成果的交互式工作区。

通过 Data Connectors 连接企业数据

Data Formulator 帮助团队将企业数据引入 AI 就绪型工作区,无需为每个数据源重复建立连接。Data Connectors 功能支持身份验证、持久连接、数据预览、元数据管理,并针对数据库、数据仓库、BI 系统、对象存储及本地文件提供统一的工作区模型。这大幅降低了平台团队的集成工作量,使用户能够基于集中管理且可复用的数据连接开展工作,而不再依赖反复的手动文件上传,如图 1 所示。

Figure 1. Data Connectors provide persistent connections between enterprise data sources and Data Formulator, allowing analysts and AI agents to load, query, and visualize shared data.
图 1. Data Connectors 在企业数据源与 Data Formulator 之间建立持久连接,使分析师和 AI 智能体能够加载、查询并可视化共享数据。

具备上下文感知能力的数据分析智能体

具备上下文感知能力的 AI 智能体是 Data Formulator 的核心。与单一的提示词不同,Data Formulator 使智能体能够访问完整的分析工作区,涵盖已连接的数据源、已加载的数据表、历史图表以及用户的目标。智能体通过调用工具而非仅依赖纯文本进行推理与操作。在单次交互中,智能体即可检视数据、在隔离环境中编写并执行代码、生成图表配置规范,并在展示中间过程的同时对结果进行解释。

当遇到表述模糊的请求时,智能体会在继续操作前主动提出澄清性问题。这使得智能体能够执行更复杂的分析工作流:确保分析方向与用户目标一致、进行数据准备与转换、推荐后续探究问题、批量生成数据表与图表,并为每一项结果生成可验证且可复现的代码。

面向迭代式数据分析的工作区

Data Formulator 将这些智能体与专为开放式分析工作流设计的多模态界面相结合。用户通过 Data Thread 与智能体进行协作,Data Thread 是一种结构化对话流,可完整记录分析过程中的每一次提问、中间发现与生成的图表。即使是长时间的会话也易于回溯导航:用户可随时重返早期步骤、衍生出替代分析路径,并在不丢失上下文的前提下进行并排对比。

如图2所示,交互式画布通过允许用户直接编辑可视化图表,与Data Thread形成互补。当用户从探索转向沟通时,他们可以直接在画布上优化图表,或用自然语言描述修改需求,由智能体调整标签、注释、布局、颜色及重点强调。分析师还可生成报告并与他人分享分析结果。

Figure 2. (Left) Data Thread allows users to interact with AI agents by asking questions, requesting data visualizations, and exploring follow-up analyses. Threads preserve the history of long analysis sessions, making it possible to revisi
图2.(左)Data Thread允许用户通过提问、请求数据可视化及探索后续分析来与AI智能体交互。Thread保留了长时间分析会话的历史记录,使用户能够回顾、复用并在早期工作基础上继续深化。(右)交互式画布允许用户直接优化可视化效果,包括调整设置、重新设计图表,以及并排检视底层数据与代码。

在此查看Data Formulator演示(在新标签页中打开),或浏览Data Formulator GitHub仓库(在新标签页中打开)。为企业数据开发分析工作流的团队可将该项目作为基础,将这些能力适配至其自有系统与具体需求中。

Opens in a new tab

原文标题

Data Formulator 0.7: AI-powered data analytics for enterprise data