📜  如何在 R 中创建频率多边形?(1)

📅  最后修改于: 2023-12-03 15:38:24.798000             🧑  作者: Mango

如何在 R 中创建频率多边形?

频率多边形是一种可视化统计数据分布的方法,通常用于连续变量的数据分布。在 R 中,我们可以使用 ggplot2 包来创建频率多边形。

准备数据

首先,我们需要准备数据。假设我们有一组身高数据,存储在一个向量 heights 中。

heights <- c(170, 165, 180, 172, 175, 178, 180, 170, 170, 165, 170, 173, 176, 185, 190, 160, 170, 172, 172, 170)
创建频率多边形

接下来,我们需要使用 ggplot2 包的 geom_freqpoly() 函数来创建频率多边形。需要注意的是,该函数需要一个数据框作为输入,因此我们需要将向量转换为数据框。

library(ggplot2)

df <- data.frame(height = heights)

ggplot(df, aes(x = height)) +
  geom_freqpoly(binwidth = 2, colour = "darkblue") +
  labs(title = "Frequency Polygon of Heights", x = "Height (cm)", y = "Frequency")

上述代码中,我们给 geom_freqpoly() 函数传递了两个参数:binwidthcolourbinwidth 表示数据分组的间隔,这里我们设置为 2,意味着每个组的宽度为 2cm。colour 表示多边形的颜色,这里我们使用了蓝色。

结果解析

运行上述代码,我们就可以得到以下频率多边形:

frequency-polygon

我们可以看到,该频率多边形显示了身高的分布情况。横轴表示身高(单位:cm),纵轴表示频率,即具有相同身高的人数。从图中可以看出,大多数人的身高在 170cm 左右,而最高的身高为 190cm。

总结

通过使用 ggplot2 包的 geom_freqpoly() 函数,我们可以很容易地创建频率多边形来分析数据的分布情况。在创建频率多边形时,我们需要设置数据分组的间隔以及多边形的颜色等参数。