Microsoft 推出 Data Formulator:一种概念驱动的可视化创作工具,利用AI代理来解决可视化创作中的数据转换挑战。
数据可视化以图形或图像格式表示数据,帮助人们理解数据中的模式、趋势和见解。有效的数据可视化在数据分析中起着至关重要的作用。它使数据分析师能够探索复杂的数据集,理解模式,并向各种利益相关者传达有意义的见解。今天,有许多工具可以创建数据的可视化表示。然而,数据必须转换成整齐的格式,以创建可视化。
因为这需要编程经验或单独的数据处理工具,所以数据转换仍然是可视化创作中的一个障碍。它需要一定的编程专业知识或熟悉额外的数据处理工具。它突出了数据可视化的复杂性,并强调了数据分析师对更简单、更无缝的流程的需求,使他们能够创建有影响力的可视化,而不管他们的技术背景如何。
因此,研究人员在克服数据可视化障碍方面取得了重大进展。他们在AI和人机交互(HCI)方面的合作努力产生了一种被称为Data Formulator的创新工具:一种人工智能驱动的可视化创作工具,引入了数据表示的突破性范式。
Data Formulator旨在简化复杂的数据可视化过程。与传统方法相比,该工具区分了高级可视化概念和数据处理的细节。数据分析师将他们的可视化想法描述为“数据概念”——他们希望看到表示的特定字段或类别,即使它们不存在于原始数据中。通过以这种方式表达他们的想法,分析师帮助人工智能代理理解他们的意思,这允许代理将概念与相关的视觉关联起来,以促进可视化过程。
Data Formulator知道分析师想要的可能不清楚,因此向他们展示了数据可视化的不同方式。它给了分析师许多选择,让一切变得更加透明。不仅如此,Data Formulator还为分析师提供了人工智能用来改变数据和新数据本身的程序。这使得分析师更容易审视一切,并为下一次做出更好的想法。
由Data Formulator调度的AI代理转换输入数据以突出这些概念,从而创建所需的可视化。在呈现结果时,Data Formulator提供反馈,以帮助作者理解和检查转换后的数据和可视化。
Data Formulator根据分析人员的输入采用两种不同的方法:基于实例的概念定义和自然语言查询。对于前者,程序合成器生成专门的数据整形程序,而后者调用语言模型(LLM)来生成代码,从而创建所描述的新数据类别。产生的转换数据与相应的可视化一起被编译成结构化表格。
除了可视化,这种方法还可以用于数据清理、集成、探索和讲故事。理想的人工智能系统将遵循高级指令,在整个数据分析管道中建议行动,并鼓励用户和人工智能代理之间的合作,以完成数据可视化目标。研究人员表示,创造能够成功地向分析师传达结果的人工智能工具——即使在不清楚、模糊或不准确的情况下——对这种合作至关重要。