📅  最后修改于: 2023-12-03 14:52:31.872000             🧑  作者: Mango
在 R 中,使用聚合函数可以对数据进行分组汇总和计算。本文将介绍如何在 R 中使用聚合函数,包括常用的聚合函数和使用方法。
mean()
函数用于计算向量或数据框的平均值。它返回给定数据的算术平均值。
# 计算向量的平均值
x <- c(1, 2, 3, 4, 5)
mean(x) # 输出为 3
# 计算数据框中每列的平均值
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
mean(df) # 输出为 x 的平均值和 y 的平均值
sum()
函数用于计算向量或数据框的总和。它返回给定数据的元素的总和。
# 计算向量的总和
x <- c(1, 2, 3, 4, 5)
sum(x) # 输出为 15
# 计算数据框中每列的总和
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
sum(df) # 输出为 x 的总和和 y 的总和
min()
函数用于计算向量或数据框的最小值,max()
函数用于计算最大值。
# 计算向量的最小值和最大值
x <- c(1, 2, 3, 4, 5)
min(x) # 输出为 1
max(x) # 输出为 5
# 计算数据框中每列的最小值和最大值
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
min(df) # 输出为 x 的最小值和 y 的最小值
max(df) # 输出为 x 的最大值和 y 的最大值
n()
函数用于计算向量或数据框的元素个数。
# 计算向量的元素个数
x <- c(1, 2, 3, 4, 5)
n(x) # 输出为 5
# 计算数据框中每列的元素个数
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
n(df) # 输出为 x 的元素个数和 y 的元素个数
除了对整个数据进行聚合外,我们还可以按照某个变量进行分组聚合。使用 aggregate()
函数可以实现这一目的。
# 创建一个数据框
df <- data.frame(group = c('A', 'A', 'B', 'B', 'C'), value = c(1, 2, 3, 4, 5))
# 按照 group 变量进行分组聚合
aggregate(value ~ group, data = df, FUN = mean)
上述代码将按组(group)计算变量(value)的平均值。aggregate()
函数的第一个参数是公式,用于指定要聚合的变量和分组变量。data
参数指定要使用的数据框,FUN
参数指定要应用的聚合函数。
本文简要介绍了在 R 中使用聚合函数的方法。我们讨论了常用的聚合函数,例如 mean()
、sum()
、min()
、max()
和 n()
,并演示了如何按组进行聚合操作。祝您在 R 中使用聚合函数时取得好的效果!