📌  相关文章
📜  Contruir tabla de frecuencia para datos agrupados en R (1)

📅  最后修改于: 2023-12-03 15:00:01.941000             🧑  作者: Mango

构建表格形式的数据频率分布 (Tabla de frecuencia)

表格形式的数据频率分布是一种简单而强大的方法,用于总结或呈现数据集的特征。它显示了每个值或值组(区间)的频率,帮助我们更好地理解数据的分布情况。在R中,可以使用freqtable包来创建表格形式的数据频率分布。

安装 freqtable 包
install.packages("freqtable")
加载 freqtable 包
library(freqtable)
示例数据

下面是我们将在本文中使用的示例数据集:

data <- c(28, 51, 58, 66, 67, 70, 74, 79, 80, 81, 81, 85, 89, 90, 90, 91, 92, 96, 96, 99)
构建频率分布

我们可以使用freq()函数来创建频率分布。它需要两个参数:

  • x: 包含我们想要计算频率分布的数据向量
  • breaks: 一个向量,用于指定我们想要对数据进行分组的区间的端点值
freq_data <- freq(data, breaks = seq(min(data), max(data)+1, by = 5))
freq_data

输出:

##   x.lower x.upper freq density percent cumulative.relative.percent
## 1      25      30    1   0.025      5                           5
## 2      30      35    0   0.000      0                           5
## 3      35      40    0   0.000      0                           5
## 4      40      45    0   0.000      0                           5
## 5      45      50    1   0.025      5                          10
## 6      50      55    0   0.000      0                          10
## 7      55      60    0   0.000      0                          10
## 8      60      65    1   0.025      5                          15
## 9      65      70    1   0.025      5                          20
## 10     70      75    2   0.050     10                          30
## 11     75      80    2   0.050     10                          40
## 12     80      85    4   0.100     20                          60
## 13     85      90    4   0.100     20                          80
## 14     90      95    2   0.050     10                          90
## 15     95     100    2   0.050     10                         100

freq()函数返回一个数据框,其中包含以下列:

  • x.lower:区间的下限
  • x.upper:区间的上限
  • freq:落在该区间内的数据数量
  • density:每个单位区间中的数据密度
  • percent:落在该区间内的数据占总数据的百分比
  • cumulative.relative.percent:落在该区间及以下的数据占总数据的累积相对百分比

以上就是在R中使用freqtable包创建数据频率分布表格的方法。您可以使用上面示例中给出的示例数据,尝试自己创建一些频率分布。