📅  最后修改于: 2023-12-03 15:38:24.798000             🧑  作者: Mango
频率多边形是一种可视化统计数据分布的方法,通常用于连续变量的数据分布。在 R 中,我们可以使用 ggplot2 包来创建频率多边形。
首先,我们需要准备数据。假设我们有一组身高数据,存储在一个向量 heights
中。
heights <- c(170, 165, 180, 172, 175, 178, 180, 170, 170, 165, 170, 173, 176, 185, 190, 160, 170, 172, 172, 170)
接下来,我们需要使用 ggplot2 包的 geom_freqpoly()
函数来创建频率多边形。需要注意的是,该函数需要一个数据框作为输入,因此我们需要将向量转换为数据框。
library(ggplot2)
df <- data.frame(height = heights)
ggplot(df, aes(x = height)) +
geom_freqpoly(binwidth = 2, colour = "darkblue") +
labs(title = "Frequency Polygon of Heights", x = "Height (cm)", y = "Frequency")
上述代码中,我们给 geom_freqpoly()
函数传递了两个参数:binwidth
和 colour
。binwidth
表示数据分组的间隔,这里我们设置为 2,意味着每个组的宽度为 2cm。colour
表示多边形的颜色,这里我们使用了蓝色。
运行上述代码,我们就可以得到以下频率多边形:
我们可以看到,该频率多边形显示了身高的分布情况。横轴表示身高(单位:cm),纵轴表示频率,即具有相同身高的人数。从图中可以看出,大多数人的身高在 170cm 左右,而最高的身高为 190cm。
通过使用 ggplot2 包的 geom_freqpoly()
函数,我们可以很容易地创建频率多边形来分析数据的分布情况。在创建频率多边形时,我们需要设置数据分组的间隔以及多边形的颜色等参数。