📅  最后修改于: 2023-12-03 15:04:46.310000             🧑  作者: Mango
R编程语言是一种用于数据分析的开源编程语言,被广泛应用于统计学、机器学习、数据挖掘等领域。其中,中心趋势是常常涉及的一个重要概念。
中心趋势是指一组数据的集中程度,常见的指标包括平均值、中位数和众数。平均值是指所有数据的总和除以数据的数量,中位数是将数据按照大小排序后位于中间的那个值,众数是出现频率最高的值。
R提供了很多用于计算中心趋势的函数和包,下面介绍几个常用的函数。
平均值可以用mean()
函数计算,该函数的参数为一组数据。下面是一个例子:
x <- c(1, 2, 3, 4, 5)
mean(x) # 计算平均值
输出结果为:
[1] 3
中位数可以用median()
函数计算,该函数的参数为一组数据。下面是一个例子:
x <- c(1, 2, 3, 4, 5)
median(x) # 计算中位数
输出结果为:
[1] 3
众数可以用Mode()
函数计算,该函数需要自己定义:
Mode <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
x <- c(1, 2, 3, 3, 4, 4, 4, 5)
Mode(x) # 计算众数
输出结果为:
[1] 4
中心趋势是数据分析中的重要概念,可以用平均值、中位数和众数等指标来描述。R提供了丰富的函数和包,方便进行中心趋势的计算。