📅  最后修改于: 2023-12-03 15:36:27.635000             🧑  作者: Mango
Dplyr 是一个在 R 语言中操作和变换数据的强大工具包,使用它可以将复杂的数据集合并、筛选、变形、求和等多种操作,而无需使用循环或其他复杂的语句。在本篇文章中,我们将学习如何使用 Dplyr 来查看数据集的摘要信息,包括数据类型、缺失值、各列统计信息等。
在使用 Dplyr 之前,我们需要安装它。可以通过以下代码安装最新版的 Dplyr:
install.packages("dplyr")
我们将使用 mtcars 数据集作为例子进行说明。在 R 中,可以通过以下命令来加载 mtcars 数据集:
data(mtcars)
可以使用以下代码来查看 mtcars 数据集的摘要信息:
library(dplyr)
mtcars %>%
summarise_all(funs(mean, sd, n(), sum(!is.na(.))))
上述代码中,summarise_all
函数可以对数据集中的所有列进行统计分析。funs
函数用于指定对于每一列应该进行哪种统计操作(如求平均值、标准差等)。在上述代码中,我们对每一列都进行了平均值、标准差、非缺失值数量和含有缺失值数量的统计分析。
当我们只需要对数据集中的部分列进行统计分析时,可以使用以下代码:
mtcars %>%
select(mpg, cyl, hp) %>%
summarise_all(funs(mean, sd, n(), sum(!is.na(.))))
在上述代码中,select
函数用于选择我们需要的列,我们只选择了 mpg、cyl 和 hp 列。其余部分和之前的代码相同。
mtcars %>%
summarise_all(funs(class))
Dplyr 提供了强大的工具来操作和转换数据集,我们可以使用 summarise_all
和 funs
函数等语句对数据集进行各种统计分析。同时,我们也可以通过 class
函数来查看数据集中各列的数据类型。以上就是本篇文章中关于使用 Dplyr 获取 R 中数据集的摘要的全部内容。