说到数据分析,别忘了数据可视化!它是数据分析中非常重要的一部分,可以揭示隐藏的趋势并提供对数据的更多洞察。数据可视化可以通过查看它们来提供信息,而从电子表格或文本报告中获取相同的信息需要更多时间。这就是数据可视化如此受欢迎的原因。在本文中,我们将讨论用于数据可视化的顶级 R 库。
由于 R 是数据分析中最流行的编程语言之一,因此有许多用于数据可视化的 R 库也就不足为奇了。这些库非常受欢迎,因为它们允许数据分析师通过在一个地方方便地提供界面和工具,轻松地从他们的数据中创建他们想要的可视化!然后唯一重要的是了解可视化想要传达给用户的内容并使用所有可用工具创建它。数据分析师还能想要什么?!
因此,让我们来看看这些天来常用的一些用于数据可视化的 Top R 库。
1. ggplot2
ggplot2 是一个基于 The Grammar of Graphics 的 R 数据可视化库。 ggplot2 可以使用高级 API 创建数据可视化,例如条形图、饼图、直方图、散点图、误差图等。它还允许您在单个可视化中添加不同类型的数据可视化组件或层。一旦 ggplot2 被告知将哪些变量映射到绘图中的哪些美学,它就会完成其余的工作,以便用户可以专注于解释可视化并减少创建它们的时间。但这也意味着无法在 ggplot2 中创建高度自定义的图形。但是 RStudio 社区和 Stack Overflow 中有很多资源可以在需要时在 ggplot2 中提供帮助。就像 dplyr 一样,如果你想安装 ggplot2,你可以安装 tidyverse 或者你可以使用 install.packages(“ggplot2”) 安装 ggplot2
2. 诡计多端
Plotly 是一个免费的开源图形库,可用于形成数据可视化。 Plotly 是一个建立在 Plotly JavaScript 库 (plotly.js) 之上的 R 包,可用于创建基于 Web 的数据可视化,这些可视化可以使用 Dash 在 Jupyter 笔记本或 Web 应用程序中显示或保存为单独的 HTML 文件。 Plotly 提供了 40 多种独特的图表类型,如散点图、直方图、折线图、条形图、饼图、误差条、箱线图、多轴、迷你图、树状图、3D 图表等。 Plotly 还提供等高线图,其中在其他数据可视化库中并不常见。除此之外,Plotly 可以在没有互联网连接的情况下离线使用。您可以使用 install.packages(‘plotly’) 从 CRAN 安装 Plotly,或者使用 devtools::install_github(“ropensci/plotly”) 从 GitHub 安装最新的开发版本。
3. 优雅
Esquisse 是 R 中的数据可视化工具,允许您使用 ggplot2 包创建详细的数据可视化。您可以使用 Esquisse 创建各种散点图、直方图、折线图、条形图、饼图、误差条、箱形图、多轴、迷你图、树状图、3-D 图表等,还可以导出这些图形或访问创建这些图形的代码。 Esquisse 是如此著名且易于使用的数据可视化工具,因为它具有拖放功能,即使在初学者中也很受欢迎。您可以使用 install.packages(“esquisse”) 从 CRAN 安装 Esquisse 或使用 remotes::install_github(“dreamRs/esquisse”) 从 GitHub 安装开发版本。
4.格子
Lattice 是一个数据可视化工具,主要用于在 R 中实现格状图。这些格状图用于同时查看许多复杂和多变量的数据集,以便进行比较。由于所有这些不同的图最终看起来都像格状图,因此称为格状图。由于 Lattice 是一个高级数据可视化库,它可以处理许多典型的图形,而无需进行许多自定义。如果您想扩展 Lattice 的功能,他们可以下载 LatticeExtra 包,这是一个扩展版本。您可以使用 install.packages(“lattice”) 从 CRAN 安装 Lattice 或使用 remotes::install_github(“deepayan/lattice”) 从 GitHub 安装开发版本。
5. RGL
R 中的 RGL 包是专门为制作 3-D 数据可视化和数据图而创建的。它有许多在 3 维中工作的图形命令,但在 R 中的经典 2-D 图形之后松散地建模。 RGL 也受到 R 中的 grid 包的启发,但与它不兼容。但是,由于熟悉网格,经验丰富的 R 编码人员可以轻松使用 RGL。而且RGL很酷!它为 3-D 形状、各种照明效果、创建新形状以及动画提供了很多选项。您可以使用 install.packages(“rgl”) 从 CRAN 安装 RGL。
6. Dygraphs
dygraphs 包是 JavaScript 图表库 dygraphs 的 R 接口,用于提供用于可视化数据集的各种图表。该软件包可用于创建各种具有缩放和平移选项以及默认鼠标悬停标签的交互式可视化。 dygraphs 还提供对各种图形叠加的支持,例如点注释、阴影区域、事件线等。您还可以自动绘制 xts 时间序列对象。但是,所有这些功能都不会以牺牲 dygraph 的速度为代价。相反,即使可视化中有数百万个数据点,它也可以提供最大的交互性。您可以使用 install.packages(“dygraphs”) 从 CRAN 安装 RGL。
7. 传单
就像 dygraphs 一样,Leaflet 包是一个非常流行的 JavaScript Leaflet 库的 R 接口。 Leaflet 在创建可在各种网站(如华盛顿邮报、纽约时报等)上看到的交互式但轻量级地图时非常有用。这个包中有许多有用的功能,例如交互式平移和缩放图表、选项结合多边形、线条、弹出窗口等来创建图表,在 knitr 中嵌入地图,在非球形的墨卡托投影中创建地图等等。使用命令 install.packages(“leaflet”) 从 CRAN 安装 Leaflet 包后,可以在 R 控制台中使用它。
如果您想创建数据可视化,所有这些用于数据可视化的 R 库都是很好的选择。这些库中的每一个都有其优势,您可以根据要创建的可视化或数据科学项目的类型选择最好的。既然您已经了解了这些库,请继续使用它们创建美观且信息丰富的数据可视化!