📜  seaborn 相关性 - Python (1)

📅  最后修改于: 2023-12-03 15:20:03.243000             🧑  作者: Mango

Seaborn 相关性- Python

Seaborn是一个Python库用于绘制统计数据可视化的图形,它是在matplotlib基础上进行开发的。其中包括对比和分析数据的方法,特别是在大型数据集的可视化方面更为方便。

Seaborn中的相关性函数可以用来绘制相关性矩阵图、热图以及散点图等,并使用不同的色谱和性质设置。

相关性矩阵图

相关性矩阵图用于呈现数据集中每个变量之间的相关性,其中数值颜色越深,表示相关性越强。

Seaborn中的heatamp()函数可以快速绘制相关性矩阵图。

import seaborn as sns
import pandas as pd

#load data
data = sns.load_dataset("iris")
#drop unwanted column
data = data.drop(columns="species")

#correlation matrix
corr = data.corr()

#plot heatmap
sns.heatmap(corr)

输出的结果如下所示:

alt text

热图

热图用于展现数据集中每个变量之间的相关性,同时还可以说明值的大小。

Seaborn中的scatterplot()函数可以绘制热图,并设置颜色映射。

import seaborn as sns
import pandas as pd

#load data
data = sns.load_dataset("tips")

#plot heatmap
sns.scatterplot(x="total_bill", y="tip", hue="size", data=data, cmap="coolwarm")

输出的结果如下所示:

alt text

散点图

散点图可以用于表示两个变量之间的相关性。

Seaborn中的scatterplot()函数可以绘制散点图,并设置颜色映射和标记大小。

import seaborn as sns
import pandas as pd

#load data
data = sns.load_dataset("tips")

#plot scatterplot
sns.scatterplot(x="total_bill", y="tip", hue="size", size="size", data=data, cmap="coolwarm")

输出的结果如下所示:

alt text

以上就是Seaborn中相关性函数的使用介绍,它们可以帮助你更好地理解你的数据集。