📜  如何使用连接 R 中的平均值的线制作箱线图?(1)

📅  最后修改于: 2023-12-03 15:24:02.069000             🧑  作者: Mango

如何使用连接 R 中的平均值的线制作箱线图?

箱线图(Boxplot)是一种常用的统计图表,它展示了实数变量的五数概括(最小值、下四分位数、中位数、上四分位数和最大值),并可以检测出数据的离群点。箱线图是用于探索性数据分析的重要工具。

本文将介绍如何使用R中的平均值线制作箱线图。

准备数据

首先,我们需要准备数据。下面是一个包含5组数据的示例数据集:

#生成示例数据集
set.seed(123)
data <- data.frame(
  group = rep(letters[1:5], each = 20),
  value = c(rnorm(20, 1, 1.5), rnorm(20, 2, 1), 
            rnorm(20, 2.5, 1.2), rnorm(20, 3, 1.3), 
            rnorm(20, 3.5, 1.4))
)
制作简单箱线图

我们可以使用ggplot2包中的geom_boxplot()函数来快速制作一个简单箱线图。该函数可以根据数据中的分组变量显示每个组的箱线图,并且可以使用fill参数来指定填充颜色。

library(ggplot2)

# 制作简单箱线图
p <- ggplot(data, aes(x = group, y = value, fill = group)) +
  geom_boxplot()
print(p)

运行代码后,可以看到一个简单的箱线图:

simple-boxplot

添加平均值线

在上面的箱线图中,我们只显示了每个组的中位数和四分位数。然而,人们有时可能需要在箱线图上添加其他统计信息,例如平均值线。

为此,我们可以使用stat_summary()函数来计算每个组的平均值,并将其添加到箱线图上。下面是一个使用stat_summary()函数添加平均值线的示例代码:

# 添加平均值线
p <- ggplot(data, aes(x = group, y = value, fill = group)) +
  geom_boxplot() +
  stat_summary(fun = mean, color = "red", 
               geom = "point", shape = 18, size = 4) +
  stat_summary(fun.data = mean_cl_normal, geom = "errorbar", 
               width = 0.3, color = "red", size = 0.7)
print(p)

运行代码后,可以看到一个添加了平均值线的箱线图:

boxplot-with-mean-line

  • fun参数指定计算每个组的统计量的函数,在本例中,我们使用mean函数计算平均值;
  • color参数指定平均值点和错误线的颜色;
  • geom参数指定平均值点的形状;
  • size参数指定平均值点和错误线的大小;
  • fun.data参数指定计算每个组的统计量及其标准误差的函数,默认情况下,mean_cl_normal()函数用于计算均值和95%置信区间。
结论

本文介绍了如何使用连接R中平均值线制作箱线图,可以使用ggplot2包中的geom_boxplot()函数和stat_summary()函数来快速制作,并添加平均值线。以上就是本文的全部内容,希望对你有所帮助。