📅  最后修改于: 2023-12-03 15:18:36.538000             🧑  作者: Mango
箱形图(Boxplot)是一种用于展示数据分布情况和异常值的统计图。在 Python 中,我们可以使用 Pandas 和 Matplotlib 来生成箱形图。
import pandas as pd
import matplotlib.pyplot as plt
首先,我们需要将数据加载到 Pandas 的数据结构中,例如 DataFrame 或 Series。此处我们使用 Pandas 中的 read_csv
方法来加载数据集。
df = pd.read_csv('data.csv')
我们可以使用 Matplotlib 的 boxplot
方法来绘制箱形图。首先,我们需要获取数据中的列,然后将其传递给 boxplot
方法。
plt.boxplot([df['column1'], df['column2'], df['column3']])
plt.show()
此处,我们绘制了三个列的箱形图。你可以根据需要增加或减少列的数量。如果你想要修改箱形图的样式,可以传递一些参数给 boxplot
方法,例如:
plt.boxplot([df['column1'], df['column2'], df['column3']],
notch=True, # 中位数处放缺口
sym='o', # 异常值的形状
vert=True, # 箱形图的方向
patch_artist=True, # 使用矩形填充箱体
labels=['Column 1', 'Column 2', 'Column 3'], # 每个箱体的标签
boxprops=dict(facecolor='pink', color='green'), # 箱体样式
flierprops=dict(markeredgecolor='red', marker='D'), # 异常值样式
medianprops=dict(color='yellow', linewidth=2)) # 中位数样式
plt.show()
你可以根据需要来修改这些参数,使箱形图更符合你的需求。
使用 Pandas 和 Matplotlib 可以轻松地生成箱形图。你可以使用这种图表来展示数据的分布情况和异常值。在绘制箱形图时,务必注意选择合适的参数和样式,让数据更加易于理解。