📜  plt boxplot pandas - Python (1)

📅  最后修改于: 2023-12-03 15:18:36.538000             🧑  作者: Mango

使用 Pandas 和 Matplotlib 生成箱形图(Boxplot)

箱形图(Boxplot)是一种用于展示数据分布情况和异常值的统计图。在 Python 中,我们可以使用 Pandas 和 Matplotlib 来生成箱形图。

1. 导入库
import pandas as pd
import matplotlib.pyplot as plt
2. 导入数据

首先,我们需要将数据加载到 Pandas 的数据结构中,例如 DataFrame 或 Series。此处我们使用 Pandas 中的 read_csv 方法来加载数据集。

df = pd.read_csv('data.csv')
3. 绘制箱形图

我们可以使用 Matplotlib 的 boxplot 方法来绘制箱形图。首先,我们需要获取数据中的列,然后将其传递给 boxplot 方法。

plt.boxplot([df['column1'], df['column2'], df['column3']])
plt.show()

此处,我们绘制了三个列的箱形图。你可以根据需要增加或减少列的数量。如果你想要修改箱形图的样式,可以传递一些参数给 boxplot 方法,例如:

plt.boxplot([df['column1'], df['column2'], df['column3']],
            notch=True,  # 中位数处放缺口
            sym='o',     # 异常值的形状
            vert=True,   # 箱形图的方向
            patch_artist=True,  # 使用矩形填充箱体
            labels=['Column 1', 'Column 2', 'Column 3'],  # 每个箱体的标签
            boxprops=dict(facecolor='pink', color='green'), # 箱体样式
            flierprops=dict(markeredgecolor='red', marker='D'), # 异常值样式
            medianprops=dict(color='yellow', linewidth=2))    # 中位数样式
plt.show()

你可以根据需要来修改这些参数,使箱形图更符合你的需求。

4. 结论

使用 Pandas 和 Matplotlib 可以轻松地生成箱形图。你可以使用这种图表来展示数据的分布情况和异常值。在绘制箱形图时,务必注意选择合适的参数和样式,让数据更加易于理解。