📅  最后修改于: 2023-12-03 15:34:53.894000             🧑  作者: Mango
Seaborn 提供了多种多面板分类图来可视化分类数据集中的多个变量。在本篇文章中,我们将说明使用 Seaborn 创建和解释常见的多面板分类图。
stripplot()
提供了一种绘制类别变量与连续变量之间关系的方法。每个类别中的每个观察结果都显示为散点图中的一个点。
import seaborn as sns
import matplotlib.pyplot as plt
# Load dataset
tips = sns.load_dataset("tips")
# Strip plot
sns.stripplot(x="day", y="total_bill", data=tips)
plt.show()
swarmplot()
是对 stripplot()
的一种改进。在 stripplot()
中,每个散点都只是沿着一维中的某个位置绘制,而 swarmplot()
将散点显示在两个维度上,避免了重叠。
# Swarm plot
sns.swarmplot(x="day", y="total_bill", data=tips)
plt.show()
boxplot()
可以显示每个类别的数据分布。在 boxplot()
中,箱体的底部边缘表示第一个四分位数,箱体的上部边缘表示第三个四分位数,箱体中间的线表示中位数。箱体之外的点表示离群值。
# Box plot
sns.boxplot(x="day", y="total_bill", data=tips)
plt.show()
violinplot()
可以显示每个类别的数据分布,并显示其密度估计。类似于 boxplot()
,它可以使用参数 split=True
将左右两边的密度分布分开。
# Violin plot
sns.violinplot(x="day", y="total_bill", data=tips)
plt.show()
boxenplot()
是一种相对较新的图形,类似于 boxplot()
,它可以显示每个类别的数据分布。但它更加详细,能够显示更多的分位数信息,对大型数据集特别有用。
# Boxen plot
sns.boxenplot(x="day", y="total_bill", data=tips)
plt.show()
barplot()
可以绘制分类变量和连续变量之间的平均值及其置信度。
# Bar plot
sns.barplot(x="day", y="total_bill", data=tips)
plt.show()
countplot()
可以用来显示每个类别的观察数量。
# Count plot
sns.countplot(x="day", data=tips)
plt.show()
在本篇文章中,我们介绍了 Seaborn 中七种展示分类变量和连续变量之间的关系的多面板分类图。它们可以帮助我们更好地理解和分析数据。根据实际情况选择适合的图形类型可以使数据更加生动清晰地呈现出来。