📅  最后修改于: 2020-11-29 07:51:11             🧑  作者: Mango
箱线图是衡量数据集中数据分布程度的一种方法。它将数据集分为三个四分位数。该图表示数据集中的最小,最大,中位数,第一四分位数和第三四分位数。通过为每个数据集绘制箱形图来比较数据在数据集之间的分布,这也很有用。
通过使用boxplot ()函数在R中创建箱线图。
在R中创建箱线图的基本语法是-
boxplot(x, data, notch, varwidth, names, main)
以下是所用参数的描述-
x是向量或公式。
data是数据帧。
缺口是一个逻辑值。设置为TRUE将绘制一个凹口。
varwidth是一个逻辑值。设置为true可绘制与样本大小成比例的盒子宽度。
名称是将在每个箱线图下打印的组标签。
main用于为图形赋予标题。
我们使用R环境中可用的数据集“ mtcars”来创建基本箱线图。让我们看一下mtcars中的“ mpg”和“ cyl”列。
input
当我们执行以上代码时,它会产生以下结果-
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
下面的脚本将为mpg(英里/加仑)和cyl(汽缸数)之间的关系创建一个箱线图。
# Give the chart file a name.
png(file = "boxplot.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
ylab = "Miles Per Gallon", main = "Mileage Data")
# Save the file.
dev.off()
当我们执行以上代码时,它产生以下结果-
我们可以使用带凹口的箱形图来找出不同数据组的中位数如何相互匹配。
下面的脚本将为每个数据组创建一个带槽口的箱形图。
# Give the chart file a name.
png(file = "boxplot_with_notch.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
xlab = "Number of Cylinders",
ylab = "Miles Per Gallon",
main = "Mileage Data",
notch = TRUE,
varwidth = TRUE,
col = c("green","yellow","purple"),
names = c("High","Medium","Low")
)
# Save the file.
dev.off()
当我们执行以上代码时,它产生以下结果-