📜  在Python中使用 seaborn 的计数图(1)

📅  最后修改于: 2023-12-03 14:51:19.761000             🧑  作者: Mango

在Python中使用 seaborn 的计数图

Seaborn是基于matplotlib库的R风格绘图接口库,于2012年创建,是针对统计数据可视化的Python库。Seaborn提供了一种高度交互性的界面、具有时尚外观的多种统计图表类型,强调独立偏差和异质误差,并且可用于微调美化细节。本篇文章将重点介绍如何在Python中使用seaborn库创建计数图。

为什么要使用计数图?

计数图(Count Plot)是Seaborn中最基本的图形之一,其可以绘制离散变量的频数和占比。在数据探索和分析过程中,我们需要了解变量的分布情况、占比情况等,而计数图正好能够满足我们的需求。因此,在进行分析时,我们使用计数图来快速的分析变量分布情况。

code snippets
导入所需库
import seaborn as sns
import matplotlib.pyplot as plt
读取数据并展示数据样本

读取自带的titanic数据集并展示前5行数据样本。

df = sns.load_dataset('titanic')
df.head()
计数图的基本绘制

使用Seaborn的countplot函数,将titanic数据集中保存的性别变量绘制成计算图。 代码:

sns.countplot(x = "sex", data = df)

运行上述代码,我们将得到一个简单的计数图,展示了数据集中性别变量的分布情况。

countplot

修改计数图样式

除了直接绘制计数图,Seaborn还允许我们通过其他参数来调整计数图的样式。

调整颜色

我们可以通过color参数来指定计数图中柱状条的颜色。

代码:

sns.countplot(x = "sex", data = df, color = "orange")

countplot_color

调整图标题和坐标轴标签

我们可以通过title参数来指定计数图中的标题。

代码:

sns.countplot(x = "sex", data = df, color = "orange")
plt.title("Passenger Gender Count")

countplot_title

调整坐标轴标签

我们可以通过xlabelylabel参数来修改x,y坐标轴的标签。

代码:

sns.countplot(x = "sex", data = df, color = "orange")
plt.title("Passenger Gender Count")
plt.xlabel("Gender")
plt.ylabel("Count")

countplot_xylabels

计数图中添加计数值

在计数图中,我们可以添加具体的计数值。这对于展示分布情况更加有帮助。

代码:

g = sns.countplot(x = "sex", data = df, color = "orange")
plt.title("Passenger Gender Count")
plt.xlabel("Gender")
plt.ylabel("Count")
for p in g.patches:
    g.annotate('{:.0f}'.format(p.get_height()), (p.get_x()+0.4, p.get_height()),
                ha='center', va='center', fontsize=11, color='black', xytext=(0,5),
                textcoords='offset points')

countplot_with_values

在上述代码中,我们使用了循环语句来完成向计数图内以文本形式显示计数的任务。在这个例子中,我们将文本改为“{:.0f}”形式来显示计数值。这样我们就能更加清楚地查看每个独立的计数值了。

总结

通过本文的介绍,我们了解了如何在Python中使用Seaborn库创建计数图。我们介绍了计数图的基本绘制和常用样式调整,以及如何向计数图中添加具体的计数值。通过学习本文内容,您可以快速的掌握使用Seaborn绘制计数图的基本方法,从而更加高效地进行数据分析。