📅  最后修改于: 2023-12-03 14:49:13.720000             🧑  作者: Mango
箱线图是一种用于展示数据分布情况的统计图表,也叫盒须图或盒式图。它能够显示出一组数据的最大值、最小值、中位数、上四分位数和下四分位数等重要统计量。通过箱线图,我们不仅可以看到数据的离散情况和偏态程度,还能用来比较不同数据集之间的差异。
箱线图一般包含以下几个部分:
下面是一个例子:
在 Python 中,我们可以使用 matplotlib
库来画箱线图。具体实现代码如下:
import matplotlib.pyplot as plt
import numpy as np
# 生成随机数据
np.random.seed(10)
data = np.random.normal(100, 20, 200)
# 画箱线图
plt.boxplot(data)
plt.show()
运行代码后,可以得到如下图:
在 R 中,我们可以使用 ggplot2
或 plotly
库来画箱线图。具体实现代码如下:
# 使用 ggplot2
library(ggplot2)
# 生成随机数据
set.seed(10)
data <- rnorm(200, mean = 100, sd = 20)
# 画箱线图
ggplot(data = data, aes(x = "", y = data)) +
geom_boxplot() +
coord_flip()
# 使用 plotly
library(plotly)
# 画箱线图
plot_ly(y = ~data, type = "box")
运行代码后,可以得到如下图:
箱线图常用于以下几个场景:
箱线图是一种重要的统计图表,通过它我们不仅可以看到数据的分布情况,还能用来比较不同数据集之间的差异。在实际应用中,我们可以使用 Python 或 R 等编程语言来画箱线图,以满足不同研究和分析需求。