📅  最后修改于: 2023-12-03 15:24:54.553000             🧑  作者: Mango
在 Pandas 中,可以使用 corr() 函数来计算两列之间的相关性。
1.导入 pandas 库并读取数据。
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
2.使用 corr() 函数计算列之间的相关性,默认情况下 corr() 函数使用皮尔逊相关系数。例如,计算 'col1' 和 'col2' 两列之间的相关性:
corr_matrix = df[['col1', 'col2']].corr()
在 corr() 函数中传递列名的列表 ['col1', 'col2'],并将结果存储在变量 corr_matrix 中。可以使用以下代码将结果打印出来:
print(corr_matrix)
此时将输出一个包含两列之间的相关性的矩阵。例如:
col1 col2
col1 1.000000 0.567296
col2 0.567296 1.000000