📅  最后修改于: 2023-12-03 15:24:02.069000             🧑  作者: Mango
箱线图(Boxplot)是一种常用的统计图表,它展示了实数变量的五数概括(最小值、下四分位数、中位数、上四分位数和最大值),并可以检测出数据的离群点。箱线图是用于探索性数据分析的重要工具。
本文将介绍如何使用R中的平均值线制作箱线图。
首先,我们需要准备数据。下面是一个包含5组数据的示例数据集:
#生成示例数据集
set.seed(123)
data <- data.frame(
group = rep(letters[1:5], each = 20),
value = c(rnorm(20, 1, 1.5), rnorm(20, 2, 1),
rnorm(20, 2.5, 1.2), rnorm(20, 3, 1.3),
rnorm(20, 3.5, 1.4))
)
我们可以使用ggplot2
包中的geom_boxplot()
函数来快速制作一个简单箱线图。该函数可以根据数据中的分组变量显示每个组的箱线图,并且可以使用fill
参数来指定填充颜色。
library(ggplot2)
# 制作简单箱线图
p <- ggplot(data, aes(x = group, y = value, fill = group)) +
geom_boxplot()
print(p)
运行代码后,可以看到一个简单的箱线图:
在上面的箱线图中,我们只显示了每个组的中位数和四分位数。然而,人们有时可能需要在箱线图上添加其他统计信息,例如平均值线。
为此,我们可以使用stat_summary()
函数来计算每个组的平均值,并将其添加到箱线图上。下面是一个使用stat_summary()
函数添加平均值线的示例代码:
# 添加平均值线
p <- ggplot(data, aes(x = group, y = value, fill = group)) +
geom_boxplot() +
stat_summary(fun = mean, color = "red",
geom = "point", shape = 18, size = 4) +
stat_summary(fun.data = mean_cl_normal, geom = "errorbar",
width = 0.3, color = "red", size = 0.7)
print(p)
运行代码后,可以看到一个添加了平均值线的箱线图:
fun
参数指定计算每个组的统计量的函数,在本例中,我们使用mean
函数计算平均值;color
参数指定平均值点和错误线的颜色;geom
参数指定平均值点的形状;size
参数指定平均值点和错误线的大小;fun.data
参数指定计算每个组的统计量及其标准误差的函数,默认情况下,mean_cl_normal()
函数用于计算均值和95%置信区间。本文介绍了如何使用连接R中平均值线制作箱线图,可以使用ggplot2
包中的geom_boxplot()
函数和stat_summary()
函数来快速制作,并添加平均值线。以上就是本文的全部内容,希望对你有所帮助。