📅  最后修改于: 2023-12-03 14:46:51.609000             🧑  作者: Mango
Box Plots 是 R 编程语言中常用的数据可视化工具,它能够有效地展示数据的分布情况。Box Plots 由五个统计量绘制而成:最小值、第一四分位数 Q1、中位数、第三四分位数 Q3 和最大值。通过这些统计量,我们可以了解数据分布的中心位置、离散程度以及是否存在异常值。
在 R 中,我们可以使用 boxplot()
函数绘制 Box Plots。下面是一个简单的例子:
# 创建随机数据
data <- rnorm(100)
# 绘制 Box Plots
boxplot(data)
在上面的例子中,我们创建了 100 个随机数,并使用 boxplot()
函数绘制了 Box Plots。可以看到,Box Plots 同时展示了数据的五个统计量,中间的长条就代表了中位数,两端的线条则代表了第一四分位数和第三四分位数,最大值和最小值则用"虚线"表示。
除了默认的 Box Plots,我们还可以自定义 Box Plots 的绘制。下面介绍几种常用的自定义方法:
我们可以使用 border
和 col
参数分别修改边框颜色和填充颜色。下面是一个例子:
# 创建随机数据
data1 <- rnorm(50, mean = 2)
data2 <- rnorm(50, mean = 5)
data3 <- rnorm(50, mean = 8)
# 绘制 Box Plots,并修改边框颜色和填充颜色
boxplot(data1, data2, data3,
border = c("red", "green", "blue"),
col = c("pink", "lightgreen", "lightblue"))
在上面的例子中,我们绘制了三组数据,每组数据的边框颜色和填充颜色都不同。border
参数接受一个字符向量或一个数字向量,每个元素对应一个 Box Plots 的颜色;col
参数的用法与 border
参数类似。
我们可以使用 text()
函数在 Box Plots 上方添加样本数量信息。下面是一个例子:
# 创建随机数据
data1 <- rnorm(20, mean = 2)
data2 <- rnorm(40, mean = 5)
data3 <- rnorm(60, mean = 8)
# 绘制 Box Plots,并在上方添加样本数量信息
boxplot(data1, data2, data3,
border = c("red", "green", "blue"),
col = c("pink", "lightgreen", "lightblue"))
# 添加样本数量信息
text(c(1, 2, 3), c(max(data1), max(data2), max(data3)),
paste("n =", length(data1), length(data2), length(data3)))
在上面的例子中,我们创建了三组数据,并在 Box Plots 上方添加了每组数据的样本数量信息。text()
函数接受三个参数:x 坐标、y 坐标以及要添加的文本内容。
我们可以使用 horizontal
参数将 Box Plots 水平绘制。下面是一个例子:
# 创建随机数据
data <- rnorm(100)
# 水平绘制 Box Plots
boxplot(data, horizontal = TRUE)
在上面的例子中,我们将 Box Plots 水平绘制。使用 horizontal
参数需要将其设为 TRUE
。
Box Plots 是 R 编程语言中常用的数据可视化工具,它能够有效地展示数据的分布情况。我们可以使用 boxplot()
函数绘制默认的 Box Plots,并使用 border
和 col
参数修改边框颜色和填充颜色。我们还可以使用 text()
函数在 Box Plots 上方添加样本数量信息,或使用 horizontal
参数将 Box Plots 水平绘制。