📜  如何在 R 中使用聚合函数(1)

📅  最后修改于: 2023-12-03 14:52:31.872000             🧑  作者: Mango

如何在 R 中使用聚合函数

在 R 中,使用聚合函数可以对数据进行分组汇总和计算。本文将介绍如何在 R 中使用聚合函数,包括常用的聚合函数和使用方法。

常用聚合函数
mean()

mean() 函数用于计算向量或数据框的平均值。它返回给定数据的算术平均值。

# 计算向量的平均值
x <- c(1, 2, 3, 4, 5)
mean(x)  # 输出为 3

# 计算数据框中每列的平均值
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
mean(df)  # 输出为 x 的平均值和 y 的平均值
sum()

sum() 函数用于计算向量或数据框的总和。它返回给定数据的元素的总和。

# 计算向量的总和
x <- c(1, 2, 3, 4, 5)
sum(x)  # 输出为 15

# 计算数据框中每列的总和
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
sum(df)  # 输出为 x 的总和和 y 的总和
min() 和 max()

min() 函数用于计算向量或数据框的最小值,max() 函数用于计算最大值。

# 计算向量的最小值和最大值
x <- c(1, 2, 3, 4, 5)
min(x)  # 输出为 1
max(x)  # 输出为 5

# 计算数据框中每列的最小值和最大值
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
min(df)  # 输出为 x 的最小值和 y 的最小值
max(df)  # 输出为 x 的最大值和 y 的最大值
n()

n() 函数用于计算向量或数据框的元素个数。

# 计算向量的元素个数
x <- c(1, 2, 3, 4, 5)
n(x)  # 输出为 5

# 计算数据框中每列的元素个数
df <- data.frame(x = c(1, 2, 3), y = c(4, 5, 6))
n(df)  # 输出为 x 的元素个数和 y 的元素个数
分组聚合

除了对整个数据进行聚合外,我们还可以按照某个变量进行分组聚合。使用 aggregate() 函数可以实现这一目的。

# 创建一个数据框
df <- data.frame(group = c('A', 'A', 'B', 'B', 'C'), value = c(1, 2, 3, 4, 5))

# 按照 group 变量进行分组聚合
aggregate(value ~ group, data = df, FUN = mean)

上述代码将按组(group)计算变量(value)的平均值。aggregate() 函数的第一个参数是公式,用于指定要聚合的变量和分组变量。data 参数指定要使用的数据框,FUN 参数指定要应用的聚合函数。

结论

本文简要介绍了在 R 中使用聚合函数的方法。我们讨论了常用的聚合函数,例如 mean()sum()min()max()n(),并演示了如何按组进行聚合操作。祝您在 R 中使用聚合函数时取得好的效果!