📜  python 如何制作多个箱线图 - Python (1)

📅  最后修改于: 2023-12-03 15:19:08.640000             🧑  作者: Mango

Python 如何制作多个箱线图

在数据分析中,箱线图是一种常见的可视化方法,它可以展示数据的分布情况、离散程度和异常值。在Python中可以使用matplotlib库来绘制箱线图,本文将介绍如何在Python中制作多个箱线图。

准备数据

首先需要准备数据,假设我们有两个数据集,分别为A和B,每个数据集包含三个变量。接下来我们使用numpy库来生成随机数据:

import numpy as np
np.random.seed(10)

A = np.random.normal(0, 1, 100)
B = np.random.normal(1, 1.5, 100)
C = np.random.normal(-1, 0.5, 100)

D = np.random.normal(2, 1, 100)
E = np.random.normal(-1, 1.5, 100)
F = np.random.normal(1, 0.5, 100)
绘制单个箱线图

首先我们可以尝试绘制单个箱线图,如下所示:

import matplotlib.pyplot as plt

data = [A, B, C]

fig, ax = plt.subplots()
ax.boxplot(data)

plt.show()

运行上述代码,可以得到一个包含三个箱线图的图形。其中,每个箱线图表示一个变量的数据分布情况。水平线表示中位数,箱体表示25%~75%的区间范围,而箱体外的线条表示数据的范围。

绘制多个箱线图

接下来我们可以将两个数据集的箱线图合并到一个图形中,如下所示:

data1 = [A, B, C]
data2 = [D, E, F]

fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(10, 5))

axes[0].boxplot(data1)
axes[0].set_title('Data Set A')

axes[1].boxplot(data2)
axes[1].set_title('Data Set B')

plt.show()

运行上述代码,可以得到一个包含两个子图的图形。每个子图表示一个数据集的数据分布情况,而其中每个箱线图则表示一个变量的数据分布情况。通过设置子图的数量和大小,我们可以灵活地控制绘图的布局。

总结

通过以上方法,我们可以在Python中轻松制作多个箱线图,这种方法可以应用于各种数据分析场景中,帮助我们更好地理解数据的分布情况、离散程度和异常值。