📅  最后修改于: 2023-12-03 14:51:19.761000             🧑  作者: Mango
Seaborn是基于matplotlib库的R风格绘图接口库,于2012年创建,是针对统计数据可视化的Python库。Seaborn提供了一种高度交互性的界面、具有时尚外观的多种统计图表类型,强调独立偏差和异质误差,并且可用于微调美化细节。本篇文章将重点介绍如何在Python中使用seaborn库创建计数图。
计数图(Count Plot)是Seaborn中最基本的图形之一,其可以绘制离散变量的频数和占比。在数据探索和分析过程中,我们需要了解变量的分布情况、占比情况等,而计数图正好能够满足我们的需求。因此,在进行分析时,我们使用计数图来快速的分析变量分布情况。
import seaborn as sns
import matplotlib.pyplot as plt
读取自带的titanic数据集并展示前5行数据样本。
df = sns.load_dataset('titanic')
df.head()
使用Seaborn的countplot
函数,将titanic
数据集中保存的性别变量绘制成计算图。
代码:
sns.countplot(x = "sex", data = df)
运行上述代码,我们将得到一个简单的计数图,展示了数据集中性别变量的分布情况。
除了直接绘制计数图,Seaborn还允许我们通过其他参数来调整计数图的样式。
我们可以通过color
参数来指定计数图中柱状条的颜色。
代码:
sns.countplot(x = "sex", data = df, color = "orange")
我们可以通过title
参数来指定计数图中的标题。
代码:
sns.countplot(x = "sex", data = df, color = "orange")
plt.title("Passenger Gender Count")
我们可以通过xlabel
和ylabel
参数来修改x,y坐标轴的标签。
代码:
sns.countplot(x = "sex", data = df, color = "orange")
plt.title("Passenger Gender Count")
plt.xlabel("Gender")
plt.ylabel("Count")
在计数图中,我们可以添加具体的计数值。这对于展示分布情况更加有帮助。
代码:
g = sns.countplot(x = "sex", data = df, color = "orange")
plt.title("Passenger Gender Count")
plt.xlabel("Gender")
plt.ylabel("Count")
for p in g.patches:
g.annotate('{:.0f}'.format(p.get_height()), (p.get_x()+0.4, p.get_height()),
ha='center', va='center', fontsize=11, color='black', xytext=(0,5),
textcoords='offset points')
在上述代码中,我们使用了循环语句来完成向计数图内以文本形式显示计数的任务。在这个例子中,我们将文本改为“{:.0f}”形式来显示计数值。这样我们就能更加清楚地查看每个独立的计数值了。
通过本文的介绍,我们了解了如何在Python中使用Seaborn库创建计数图。我们介绍了计数图的基本绘制和常用样式调整,以及如何向计数图中添加具体的计数值。通过学习本文内容,您可以快速的掌握使用Seaborn绘制计数图的基本方法,从而更加高效地进行数据分析。