📜  pearson 相关系数公式 (1)

📅  最后修改于: 2023-12-03 15:18:17.460000             🧑  作者: Mango

Pearson 相关系数公式

Pearson 相关系数是一种用于衡量两个变量之间的线性关系强度的度量方式。它衡量的是两个变量的协方差与它们各自标准差的乘积之比。Pearson 相关系数的取值范围为 -1 到 1,其中取值为 -1 表示完全负相关,取值为 1 表示完全正相关,取值为 0 表示没有线性关系。

公式

Pearson 相关系数的公式如下:

pearson formula

其中,x 和 y 分别为两个变量。n 表示样本量,μx 和 μy 分别表示 x 和 y 的均值,σx 和 σy 分别表示 x 和 y 的标准差。

代码实现

在 Python 中,我们可以使用 NumPy 库中的 numpy.corrcoef 函数来计算 Pearson 相关系数。该函数的参数为两个数组,即需要计算相关系数的两个变量。

import numpy as np

# 生成两个随机数列,用于演示计算相关系数
x = np.random.random(10)
y = np.random.random(10)

# 计算 Pearson 相关系数
correlation = np.corrcoef(x, y)[0, 1]
print(f"Pearson 相关系数为 {correlation:.4f}")

输出结果:

Pearson 相关系数为 -0.5029
总结

Pearson 相关系数是一种常用的衡量两个变量之间线性关系强度的方式,它的取值范围为 -1 到 1。在计算 Pearson 相关系数时,我们可以使用 NumPy 库中的 numpy.corrcoef 函数来快速计算。