使用 Dply 获取 R 中数据集的摘要
在本文中,我们将讨论如何使用 Dplyr 包在 R 编程语言中获取数据集的摘要。要获取数据集的摘要,使用此模块的 summarise()函数。此函数基本上根据对组或未分组数据的某些所需操作提供摘要,这反过来有助于汇总数据集。
Syntax: summarize(action)
使用的数据集: bestsellers3
在这里,动作可以是对分组数据执行的任何操作,可以是频率计数、平均值、平均值等。
示例:使用summary() 汇总数据集
R
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize(n())
R
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize_all(mean)
R
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize_at(c('User.Rating','Price'),mean)
R
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize_if(is.numeric, mean)
输出:
# A tibble: 2 x 2
Genre `n()`
1 Fiction 82
2 Non Fiction 117
总结未分组的数据集
还可以汇总未分组的数据。有三种可能的功能可用于此目的。
- 汇总_全部()。
- 总结_at()。
- 总结_if()。
总结_全部():
summarise_all()函数根据要执行的操作汇总所有列。
Syntax: summarize_all(action)
电阻
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize_all(mean)
输出:
总结_at():
summary_at()函数用于将所需的操作应用于某些特定列并基于该操作生成摘要
Syntax: summarize_at(vector_of_columns,action)
电阻
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize_at(c('User.Rating','Price'),mean)
输出:
总结_if():
如果指定了某个条件,则使用summarize_if()函数获取数据集摘要。
Syntax: summarize_if(condition, action)
电阻
library(dplyr)
data<-read.csv("bestsellers.csv")
data %>% group_by(Genre) %>%
summarize_if(is.numeric, mean)
输出: