📌  相关文章
📜  如何计算 Pandas 中两列之间的相关性?(1)

📅  最后修改于: 2023-12-03 15:24:54.553000             🧑  作者: Mango

如何计算 Pandas 中两列之间的相关性?

在 Pandas 中,可以使用 corr() 函数来计算两列之间的相关性。

方法:

1.导入 pandas 库并读取数据。

import pandas as pd

# 读取数据
df = pd.read_csv('data.csv')

2.使用 corr() 函数计算列之间的相关性,默认情况下 corr() 函数使用皮尔逊相关系数。例如,计算 'col1' 和 'col2' 两列之间的相关性:

corr_matrix = df[['col1', 'col2']].corr()

在 corr() 函数中传递列名的列表 ['col1', 'col2'],并将结果存储在变量 corr_matrix 中。可以使用以下代码将结果打印出来:

print(corr_matrix)

此时将输出一个包含两列之间的相关性的矩阵。例如:

          col1      col2
col1  1.000000  0.567296
col2  0.567296  1.000000
现在,你已经知道如何在 Pandas 中计算两列之间的相关性。