R编程中的绝对频率和相对频率
在统计学中,频率或绝对频率表示数据值出现的次数或数据值出现的次数。这些频率通常绘制在条形图或直方图上以比较数据值。例如,找出特定区域的儿童、成人和老年人的数量,根据某些标准创建民意调查等。
在 R 语言中,频率可以描述为绝对频率和相对频率。
绝对频率
绝对频率显示值在数据向量中重复的次数。
公式:
在哪里,
is represented as absolute frequency of each value
N represents total number of data values
在 R 中,可以使用table()
函数创建数据向量的频率表。
句法:
table(x)
在哪里,
x是数据向量
例子:
假设在下面的数据向量中,“M”代表男性,“F”代表女性。
# Defining vector
x <- c("M", "M", "F", "M", "M", "M", "F", "F", "F", "M")
# Absolute frequency table
af <- table(x)
# Printing frequency table
print(af)
# Check the class
class(af)
输出:
x
F M
4 6
[1] "table"
相对频率
相对频率是该事件的绝对频率除以事件总数。它表示数据向量中存在的特定数据类别的比例。数学上,
在哪里,
represents the relative frequency of event
is represented as absolute frequency of each value
N represents total number of data values
在 R 语言中, table()
函数和数据向量的长度一起用于查找数据向量的相对频率。
句法:
table(x)/length(x)
例子:
# Defining vector
x <- c("M", "M", "F", "M", "M", "M", "F", "F", "F", "M")
# Relative frequency table
rf <- table(x)/length(x)
# Printing frequency table
print(rf)
# Check the class
class(rf)
输出:
x
F M
0.4 0.6
[1] "table"