📅  最后修改于: 2023-12-03 14:52:00.905000             🧑  作者: Mango
在数据分析过程中,经常需要对变量之间的关系进行探索。而制作配对图可以方便我们同时查看多个变量之间的散点图和直方图,从而可以初步了解变量之间的关系。Pandas 是一种常用的 Python 数据分析库,本文将介绍如何使用 Pandas 制作配对图。
首先我们需要准备一些数据,以下是一个简单的例子:
import pandas as pd
import numpy as np
# 生成随机数据
np.random.seed(1234)
df = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
这里我们生成了一个 100 行、4 列的随机数据集,其中每一列的名字分别为 'A'、'B'、'C'、'D'。
使用 Pandas 制作配对图非常简单,只需要使用 pairplot
函数即可。下面是一个例子:
import seaborn as sns
sns.pairplot(df)
运行上述代码,就可以得到一个包含散点图和直方图的配对图了。
Markdown 返回代码片段:
import pandas as pd
import numpy as np
import seaborn as sns
# 生成随机数据
np.random.seed(1234)
df = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
# 制作配对图
sns.pairplot(df)
除了默认的配对图外,我们还可以进行更多的配置,以满足实际需求。下面是一些可用的参数:
hue
:用于根据某个分类变量对数据进行不同颜色的标记。diag_kind
:对角线上的图形类型,可以是 'hist'(直方图)或 'kde'(核密度图)两者之一。palette
:颜色调色板。markers
:标记类型。size
:标记大小。下面是一个配置参数的例子:
# 制作配对图,并进行高级配置
sns.pairplot(df, hue='A', diag_kind='kde', markers='+', palette='husl', height=2, aspect=1.5)
Markdown 返回代码片段:
# 制作配对图,并进行高级配置
sns.pairplot(df, hue='A', diag_kind='kde', markers='+', palette='husl', height=2, aspect=1.5)
使用 Pandas 制作配对图非常方便,只需要使用 pairplot
函数即可。在这里我们还介绍了如何进行高级配置,以满足不同的需求。