Data Formulator – 微软研究院开源的 AI 数据可视化工具


Data Formulator是什么

Data Formulator是微软研究院推出的开源 AI 驱动的数据可视化工具,帮助用户通过简单交互和指令快速创建丰富的数据可视化。结合了图形化用户界面(GUI)和自然语言输入(NL),用户可以通过拖拽操作或直接输入需求来设计图表,AI 负责处理复杂的数据转换。
Data Formulator - 微软研究院开源的 AI 数据可视化工具

Data Formulator的主要功能

  • 结合图形化界面与自然语言输入:用户可以通过拖拽操作将数据字段放置到图表属性中,也可以通过自然语言描述需求,AI 会根据指令完成数据转换和可视化。
  • 支持复杂数据转换:用户可以在编码栏中输入不存在的数据字段名称,AI 会根据自然语言提示进行数据计算和转换,生成新的可视化内容。
  • 迭代可视化设计:Data Formulator 提供了“数据线程”功能,用户可以基于现有图表进行进一步操作,AI 会根据自然语言指令更新图表。
  • 结果验证与错误纠正:用户可以查看 AI 生成的转换数据、可视化图表和代码,通过代码解释模块理解数据转换过程。如果发现错误,可以用数据线程的迭代机制进行纠正。
  • 灵活的图表样式调整:用户可以在不进行额外数据转换的情况下,直接在概念编码架上调整图表样式(如颜色方案、轴排序等),即时看到视觉反馈。

Data Formulator的技术原理

  • 多模态交互界面:Data Formulator 结合了图形化用户界面(GUI)和自然语言输入(NL),用户可以通过拖拽操作或直接输入自然语言指令来定义可视化需求。“双管齐下”的方式让用户能根据自己的习惯选择操作方式,通过界面操作还是语言描述,能高效地传达需求。
  • 概念绑定与数据转换:用户首先通过自然语言或示例定义他们计划可视化的数据概念,然后将这些概念绑定到可视化通道(如 x 轴、y 轴、颜色等)。Data Formulator 会通过其 AI 代理(Agent)自动将输入数据转换为所需的格式,生成所需的可视化。
  • AI 代理与代码生成:Data Formulator 的后端使用 Flask 框架,通过 RESTful API 接收前端请求。当用户点击“Formulate”按钮时,前端会发送一个 POST 请求到后端的 /derive-data 接口。后端根据用户输入的指令和数据,调用 AI 代理(如 DataTransformationAgentV2)生成 Python 代码,执行这些代码以完成数据转换。
  • 数据处理与反馈机制:Data Formulator 提供了数据线程功能,用户可以基于现有图表进行进一步操作,AI 会根据自然语言指令更新图表。Data Formulator 提供了反馈机制,用户可以查看 AI 生成的转换数据、可视化图表和代码,确保结果符合预期。
  • 开源与灵活性:Data Formulator 是开源项目,用户可以通过 Python PIP 安装并本地运行,也可以在 GitHub Codespaces 中直接使用。

Data Formulator的项目地址

Data Formulator的应用场景

  • 数据分析与可视化:Data Formulator 可以帮助用户快速将复杂数据转换为直观的可视化图表。帮助他们快速发现数据中的趋势和模式。
  • 数据概念扩展与计算:用户可以通过自然语言输入定义不存在的数据概念。例如,在分析可持续能源数据时,用户可以在 y 轴上添加“可持续能源百分比”这一数据概念,即使原始数据中没有直接提供百分比值,Data Formulator 也会自动计算并生成相应的可视化。
  • 迭代与优化:Data Formulator 支持基于现有图表的迭代设计。用户可以通过自然语言指令对现有图表进行修改和优化,无需从头开始描述整个设计。
  • 多模态交互:用户可以通过图形化界面(拖拽操作)或自然语言输入来定义可视化需求。使 Data Formulator 适合不同技能水平的用户。
© 版权声明

© 版权声明

相关文章

暂无评论

暂无评论...