📅  最后修改于: 2023-12-03 15:19:08.640000             🧑  作者: Mango
在数据分析中,箱线图是一种常见的可视化方法,它可以展示数据的分布情况、离散程度和异常值。在Python中可以使用matplotlib库来绘制箱线图,本文将介绍如何在Python中制作多个箱线图。
首先需要准备数据,假设我们有两个数据集,分别为A和B,每个数据集包含三个变量。接下来我们使用numpy库来生成随机数据:
import numpy as np
np.random.seed(10)
A = np.random.normal(0, 1, 100)
B = np.random.normal(1, 1.5, 100)
C = np.random.normal(-1, 0.5, 100)
D = np.random.normal(2, 1, 100)
E = np.random.normal(-1, 1.5, 100)
F = np.random.normal(1, 0.5, 100)
首先我们可以尝试绘制单个箱线图,如下所示:
import matplotlib.pyplot as plt
data = [A, B, C]
fig, ax = plt.subplots()
ax.boxplot(data)
plt.show()
运行上述代码,可以得到一个包含三个箱线图的图形。其中,每个箱线图表示一个变量的数据分布情况。水平线表示中位数,箱体表示25%~75%的区间范围,而箱体外的线条表示数据的范围。
接下来我们可以将两个数据集的箱线图合并到一个图形中,如下所示:
data1 = [A, B, C]
data2 = [D, E, F]
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(10, 5))
axes[0].boxplot(data1)
axes[0].set_title('Data Set A')
axes[1].boxplot(data2)
axes[1].set_title('Data Set B')
plt.show()
运行上述代码,可以得到一个包含两个子图的图形。每个子图表示一个数据集的数据分布情况,而其中每个箱线图则表示一个变量的数据分布情况。通过设置子图的数量和大小,我们可以灵活地控制绘图的布局。
通过以上方法,我们可以在Python中轻松制作多个箱线图,这种方法可以应用于各种数据分析场景中,帮助我们更好地理解数据的分布情况、离散程度和异常值。