📅  最后修改于: 2023-12-03 15:18:17.460000             🧑  作者: Mango
Pearson 相关系数是一种用于衡量两个变量之间的线性关系强度的度量方式。它衡量的是两个变量的协方差与它们各自标准差的乘积之比。Pearson 相关系数的取值范围为 -1 到 1,其中取值为 -1 表示完全负相关,取值为 1 表示完全正相关,取值为 0 表示没有线性关系。
Pearson 相关系数的公式如下:
其中,x 和 y 分别为两个变量。n 表示样本量,μx 和 μy 分别表示 x 和 y 的均值,σx 和 σy 分别表示 x 和 y 的标准差。
在 Python 中,我们可以使用 NumPy 库中的 numpy.corrcoef
函数来计算 Pearson 相关系数。该函数的参数为两个数组,即需要计算相关系数的两个变量。
import numpy as np
# 生成两个随机数列,用于演示计算相关系数
x = np.random.random(10)
y = np.random.random(10)
# 计算 Pearson 相关系数
correlation = np.corrcoef(x, y)[0, 1]
print(f"Pearson 相关系数为 {correlation:.4f}")
输出结果:
Pearson 相关系数为 -0.5029
Pearson 相关系数是一种常用的衡量两个变量之间线性关系强度的方式,它的取值范围为 -1 到 1。在计算 Pearson 相关系数时,我们可以使用 NumPy 库中的 numpy.corrcoef
函数来快速计算。