使用 Tableau 进行 Covid-19 数据分析
Tableau 是一款用于数据可视化和分析的软件。它是一种可以使数据分析更容易的工具。可视化可以采用工作表或仪表板的形式。以下是在 Tableau 工具中使用 covid-19 数据集创建工作表和仪表板的一些简单步骤。
资料链接:https://data.world/covid-19-data-resource-hub/covid-19-case-counts
数据说明:数据集主要分为3个CSV文件。每个文件的属性数为 5,实例数为 44,757。
- 确诊病例(time_series_covid19_confirmed_global_narrow.csv)。
- 恢复的病例(time_series_covid19_recovered_global_narrow.csv)。
- 死亡案例(time_series_covid19_deaths_global_narrow.csv)。
步骤 1:从 https://www.tableau.com/products/desktop/download 下载 Tableau 。 Tableau 为客户提供 14 天的免费试用。
第 2 步:开始使用 Tableau
Tableau 为用户提供在线视频和付费直播课堂。初学者可以探索这些视频并在不同的数据集上实现可视化。这些视频讨论了连接数据、数据准备和创建仪表板。
在“连接选项卡”中,我们可以连接不同格式的数据。例如,它可以是 JSON 格式或 PDF 文件等。
这是我们可以创建可视化的工作表。
第 4 步:创建工作表
只需将所需的属性拖到行和列上即可!!!!我创建了我的第一个关于全球“死亡病例数”的工作表。拖动列上的已确认属性(出现在 Tableau 的顶部栏中)并将其更改为 SUM。拖动行上的国家属性(出现在画面的顶部栏中)。将属性日期拖放到 Pages 中。在 Tableau 的右上角,我们可以将其更改为地图的“显示”选项卡。它已经完成了。
该视频代表了 1 月 21 日至 7 月 31 日报告的死亡病例数。该图显示了世界各地死亡病例的增长情况。病例从 2 月底开始增加,最初来自中国。目前美国的死亡病例最多,其次是巴西和英国(请注意:可视化时间为 1 月 21 日至 7 月 31 日)。
第二张工作表是关于全球“确诊病例”的。上述任务执行相同,但在Confirmed.csv文件上
视频显示,截至 2 月 1 日,全球报告的病例不超过 100 例。病例首先在中国开始报告,而不是在世界范围内缓慢报告。到四月中旬,世界上几乎所有国家都受到了影响。目前美国确诊病例最多,超过350万例。
第三张关于全球“康复病例”的工作表。
上图显示了全球康复病例的增长情况。我们可以通过选择不同类型的地图来使图形变得丰富多彩。
理解数据:
一、全球确诊病例累计图
将日期属性拖放到列上。在行上拖放已确认的属性并更改为聚合类型。图表已准备就绪。我们还可以通过在 Tableau 的右上角拖放日期来使用视频来表示此图表。
2.全球治愈病例累计图
3.全球死亡病例累计图
4.关于不同国家和曲线的确认案例
从视频中我们可以得出结论,与其他国家相比,美国的曲线完全不同,因为它的确诊病例数量最多。
5.根据不同国家曲线分析康复病例
通过上图,我们可以推断出与美国相比,巴西的治愈病例数最多。
6.根据不同国家曲线分析死亡案例。
查看死亡曲线并将其与之前的确诊病例曲线进行比较,我们可以推断,尽管印度的确诊病例数高于英国和墨西哥,但其死亡率低于这些国家。
7.已确认案例 条形图。
条形图给出了全国范围内确诊病例的确切数量
8.Recovered cases 条形图
上方的条形图表示截至 2020 年 7 月 16 日的国家/地区总回收次数
9.死亡案例条形图
上方的条形图表示截至 2020 年 7 月 16 日的国家/地区死亡总数
10. 受影响最严重的前 3 个国家及其比较
可以将所有工作表放在一起以获得仪表板。