📅  最后修改于: 2023-12-03 15:27:11.250000             🧑  作者: Mango
小提琴图(violin plot)是一种常用的数据可视化方式,更适用于表现数据分布情况的一种图形,它能够同时展示数据的分布情况、密度曲线和箱线图等信息。
在Python中,有很多画小提琴图的库,常用的有Seaborn、Matplotlib等,其中Seaborn比较受欢迎。你可以在终端中使用pip来安装Seaborn,命令如下:
pip install seaborn
下面是一段绘制小提琴图的代码:
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style="whitegrid")
# 加载数据
tips = sns.load_dataset("tips")
# 绘制小提琴图
ax = sns.violinplot(x="day", y="total_bill", hue="sex", data=tips, palette="Set2", split=True, scale="count")
plt.show()
sns.set(style="whitegrid")
:设置画布的风格,这里我们选择了whitegrid
。tips = sns.load_dataset("tips")
:加载数据,这里我们使用Seaborn自带的tips
数据集。ax = sns.violinplot(x="day", y="total_bill", hue="sex", data=tips, palette="Set2", split=True, scale="count")
:绘制小提琴图,其中各个参数含义如下:x
:指定X轴所使用的数据,这里是天数(day)。y
:指定Y轴所使用的数据,这里是账单总额(total_bill)。hue
:根据性别(sex)来分组,使用不同的颜色表示。data
:使用的数据集。palette
:颜色主题设置,这里我们使用Seaborn自带的Set2。split
:是否将小提琴图分为两半。scale
:确定小提琴图的大小,可以选择area
,width
,count
,这里我们使用count
。小提琴图适用于展示数据的分布状况,利用它可以更直观地比较不同组别之间的数据,也能够同时展示数据的密度曲线和箱线图等信息,更有效地表达数据的分布情况。