📜  使用 Dply 获取 R 中数据集的摘要(1)

📅  最后修改于: 2023-12-03 15:36:27.635000             🧑  作者: Mango

使用 Dply 获取 R 中数据集的摘要

Dplyr 是一个在 R 语言中操作和变换数据的强大工具包,使用它可以将复杂的数据集合并、筛选、变形、求和等多种操作,而无需使用循环或其他复杂的语句。在本篇文章中,我们将学习如何使用 Dplyr 来查看数据集的摘要信息,包括数据类型、缺失值、各列统计信息等。

安装 Dplyr

在使用 Dplyr 之前,我们需要安装它。可以通过以下代码安装最新版的 Dplyr:

install.packages("dplyr")
加载数据集

我们将使用 mtcars 数据集作为例子进行说明。在 R 中,可以通过以下命令来加载 mtcars 数据集:

data(mtcars)
查看数据集摘要

可以使用以下代码来查看 mtcars 数据集的摘要信息:

library(dplyr)

mtcars %>%
    summarise_all(funs(mean, sd, n(), sum(!is.na(.))))

上述代码中,summarise_all 函数可以对数据集中的所有列进行统计分析。funs 函数用于指定对于每一列应该进行哪种统计操作(如求平均值、标准差等)。在上述代码中,我们对每一列都进行了平均值、标准差、非缺失值数量和含有缺失值数量的统计分析。

查看部分列的摘要信息

当我们只需要对数据集中的部分列进行统计分析时,可以使用以下代码:

mtcars %>%
    select(mpg, cyl, hp) %>%
    summarise_all(funs(mean, sd, n(), sum(!is.na(.))))

在上述代码中,select 函数用于选择我们需要的列,我们只选择了 mpg、cyl 和 hp 列。其余部分和之前的代码相同。

查看数据集中各列的数据类型
mtcars %>%
   summarise_all(funs(class))
总结

Dplyr 提供了强大的工具来操作和转换数据集,我们可以使用 summarise_allfuns 函数等语句对数据集进行各种统计分析。同时,我们也可以通过 class 函数来查看数据集中各列的数据类型。以上就是本篇文章中关于使用 Dplyr 获取 R 中数据集的摘要的全部内容。