📜  Python – 两个变量之间的 Pearson 相关性检验(1)

📅  最后修改于: 2023-12-03 15:34:07.335000             🧑  作者: Mango

Python – 两个变量之间的 Pearson 相关性检验

Pearson 相关性检验是一种用于测试两个变量之间线性关系的方法。在统计学中,它也被称为 Pearson 相关系数检验,可以用来计算两个变量之间的相关系数。

在 Python 中,我们可以使用 SciPy 模块中的 pearsonr 函数来计算两个变量之间的 Pearson 相关性检验。

参数说明

pearsonr 函数的语法是:

pearsonr(x, y)

参数 x 和 y 是两个数组,分别包含两个变量的观察值。

返回值说明

pearsonr 函数将返回一个包含两个值的元组。

第一个值是 Pearson 相关系数,取值范围介于 -1 和 1 之间。如果 Pearson 相关系数的值为 0,则说明两个变量之间不存在线性关系;如果值大于 0,则说明两个变量之间存在正相关关系;如果值小于 0,则说明两个变量之间存在负相关关系。

第二个值是 p-value,表示假设成立的可能性,取值范围是 0 到 1。如果 p-value 的值小于 0.05,则说明假设成立的可能性很小,我们可以拒绝假设;如果 p-value 的值大于等于 0.05,则说明假设成立的可能性很大,我们不能拒绝假设。

示例代码

下面是一个使用 pearsonr 函数计算两个变量之间 Pearson 相关性检验的示例代码:

import scipy.stats as stats
import numpy as np

# 生成两个变量的观测值
x = np.random.normal(0, 1, size=100)
y = np.random.normal(0, 1, size=100)

# 计算 Pearson 相关系数和 p-value
corr, pval = stats.pearsonr(x, y)

# 打印结果
print("Pearson correlation coefficient: %.2f (p-value: %.2f)" % (corr, pval))

输出:

Pearson correlation coefficient: -0.08 (p-value: 0.44)

可以看到,这个示例代码生成了两个变量 x 和 y 的观测值,然后使用 pearsonr 函数计算了它们之间的 Pearson 相关系数和 p-value。根据输出结果,我们可以判断出两个变量之间的相关性较小,假设成立的可能性很大。

总结

本文介绍了如何使用 Python 中的 SciPy 模块中的 pearsonr 函数来计算两个变量之间的 Pearson 相关性检验。通过本文的学习,读者可以更好地理解 Pearson 相关系数的概念和计算方法,并能够使用 Python 对数据进行相关性分析。