📅  最后修改于: 2023-12-03 15:04:10.084000             🧑  作者: Mango
百分比图是一种可以用来比较分类变量和不同组之间数量或比例的可视化工具。在Python中,我们可以使用seaborn库和hue参数轻松地创建分类变量的百分比图,该库提供了许多自定义选项,可以让我们根据需要或喜好自定义图表样式。
在进行百分比图的可视化之前,我们需要导入seaborn和matplotlib库,这两个库均可使用pip install命令进行安装。
import seaborn as sns
import matplotlib.pyplot as plt
接下来,我们需要准备我们的数据。在此示例中,我们将使用来自seaborn库内置的titanic数据集,该数据集包含了泰坦尼克号上乘客的信息,包括性别、年龄、船舱等级和是否存活等信息。
titanic = sns.load_dataset('titanic')
现在我们已经准备好数据,可以开始创建我们的百分比图了。在seaborn中,我们可以使用catplot函数来绘制分类变量的图表,通过hue参数可以对数据进行分组,从而创建百分比图。
在下面的示例中,我们将使用hue参数将数据按性别分组,并在图表上显示每个性别中存活的百分比。
sns.catplot(x='sex', y='survived', hue='class', kind='bar', data=titanic, ci=None)
plt.show()
执行上面的代码后,我们将看到一个美观的百分比图,其中横轴表示性别,纵轴表示百分比,并用不同颜色的方块区分了不同船舱等级的存活率。
我们还可以根据需要或喜好对百分比图进行自定义。例如,可以调整图表大小和比例、添加标题和标签、选择不同的调色板、更改x轴和y轴的标签等。
在下方示例中,我们将对上面的百分比图进行自定义处理,具体如下:
sns.set_style('whitegrid')
sns.set(rc={'figure.figsize':(9,6)})
sns.catplot(x='sex', y='survived', hue='class', kind='bar', data=titanic,
palette="pastel", linewidth=3, ci=None)
plt.title('Percentage of Survivors by Gender and Class', fontsize=16)
plt.xlabel('Gender', fontsize=14)
plt.ylabel('Survival Rate (%)', fontsize=14)
plt.yticks(fontsize=12)
plt.legend(title='Class', fontsize=14, loc='upper right')
sns.despine(left=True)
plt.show()
百分比图是一种可视化工具,可用于比较分类变量之间数量或比例的不同组。在Python中,我们可以使用seaborn库和hue参数轻松地创建分类变量的百分比图,并可以根据需要或喜好进行自定义。通过掌握这一技能,我们可以更轻松地进行数据分析,并更方便地发现数据中的模式和趋势。