📌  相关文章
📜  如何计算 Pandas 中两列之间的相关性?

📅  最后修改于: 2022-05-13 01:55:44.193000             🧑  作者: Mango

如何计算 Pandas 中两列之间的相关性?

在本文中,我们将讨论如何计算 pandas 中两列之间的相关性

相关性用于总结两个定量变量之间线性关联的强度和方向。它由 r 表示,值介于 -1 和 +1 之间。 r 的正值表示正关联,r 的负值表示负关联。

通过使用 corr()函数,我们可以获得数据框中两列之间的相关性。

语法

在哪里,

  • 数据框是输入数据框
  • first_column 与数据帧的 second_column 相关

示例 1 :获取两列之间相关性的Python程序

Python3
# import pandas module
import pandas as pd
 
# create dataframe with 3 columns
data = pd.DataFrame({
    "column1": [12, 23, 45, 67],
    "column2": [67, 54, 32, 1],
    "column3": [34, 23, 56, 23]
}
)
# display dataframe
print(data)
 
# correlation between column 1 and column2
print(data['column1'].corr(data['column2']))
 
# correlation between column 2 and column3
print(data['column2'].corr(data['column3']))
 
# correlation between column 1 and column3
print(data['column1'].corr(data['column3']))


Python3
# import pandas module
import pandas as pd
 
# create dataframe with 3 columns
data = pd.DataFrame({
    "column1": [12, 23, 45, 67],
    "column2": [67, 54, 32, 1],
    "column3": [34, 23, 56, 23]
}
)
# get correlation between element wise
print(data.corr())


输出:

column1  column2  column3
0       12       67       34
1       23       54       23
2       45       32       56
3       67        1       23
-0.9970476685163736
0.07346999975265099
0.0

也可以仅使用 corr()函数获得数值列的元素相关性。

句法:

dataset.corr()

示例 2 :获取元素相关性

Python3

# import pandas module
import pandas as pd
 
# create dataframe with 3 columns
data = pd.DataFrame({
    "column1": [12, 23, 45, 67],
    "column2": [67, 54, 32, 1],
    "column3": [34, 23, 56, 23]
}
)
# get correlation between element wise
print(data.corr())

输出

column1   column2  column3
column1  1.000000 -0.997048  0.00000
column2 -0.997048  1.000000  0.07347
column3  0.000000  0.073470  1.00000