📜  使用 Dply 获取 R 中数据集的摘要

📅  最后修改于: 2022-05-13 01:54:25.071000             🧑  作者: Mango

使用 Dply 获取 R 中数据集的摘要

在本文中,我们将讨论如何使用 Dplyr 包在 R 编程语言中获取数据集的摘要。要获取数据集的摘要,使用此模块的 summarise()函数。此函数基本上根据对组或未分组数据的某些所需操作提供摘要,这反过来有助于汇总数据集。

使用的数据集: bestsellers3

在这里,动作可以是对分组数据执行的任何操作,可以是频率计数、平均值、平均值等。

示例:使用summary() 汇总数据集



R
library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize(n())


R
library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize_all(mean)


R
library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize_at(c('User.Rating','Price'),mean)


R
library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize_if(is.numeric, mean)


输出:

# A tibble: 2 x 2
 Genre       `n()`
        
1 Fiction        82
2 Non Fiction   117

总结未分组的数据集

还可以汇总未分组的数据。有三种可能的功能可用于此目的。

  • 汇总_全部()。
  • 总结_at()。
  • 总结_if()。

总结_全部():

summarise_all()函数根据要执行的操作汇总所有列。

电阻

library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize_all(mean)

输出:



总结_at():

summary_at()函数用于将所需的操作应用于某些特定列并基于该操作生成摘要

电阻

library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize_at(c('User.Rating','Price'),mean)

输出:

总结_if():

如果指定了某个条件,则使用summarize_if()函数获取数据集摘要。

电阻

library(dplyr)
  
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
  summarize_if(is.numeric, mean)

输出: