Tableau 中的数据清理
要在 Tableau 中可视化数据,我们需要一个数据源文件。大多数情况下,数据文件不包含稻草值,可以直接用于可视化。但可能存在数据源未格式化且需要清理的情况。因此,本文旨在了解如何在 Tableau 中清理数据文件。
要遵循的步骤:
- 打开 Tableau 并添加数据源文件 – YearlyData
- 但是这个数据可能有问题。第一个指示可能是显示的消息,说明 Data Interpreter 可能能够清理我的 Excel 工作簿。
- 到目前为止还不清楚实际问题是什么,所以让我们加载数据 -产品表。
- 可以清楚地看到,数据上面有一个Year2016的杂散值,其中ProductID 、 ProductName和ProductCategory也存在。
- 要清理数据,请转到左侧窗格的工作表部分并选中Use Data Interpreter。这将清理数据, Year2016值消失了,并且数据的ProductID、ProductName、ProductCategory 和 Price显示为应有的样子。
- 转到Sheet ,在 dimensions 下,它有ProductCategory和ProductName ,在Measures下,数据有Price和ProductID 。
- ProductID实际上是维度而不是度量,因此将鼠标指针悬停在ProductID上,单击其向下箭头,然后单击转换为维度。
- 现在, ProductID是可在此处使用的可搜索和可排序的值。
- 如果数据源过于复杂,Data Interpreter 可能无法提供帮助,但如果您的数据中存在单个杂散值或某些不规则格式,那么使用 Data Interpreter 是解决该问题的好方法