📜  相关系数公式(1)

📅  最后修改于: 2023-12-03 15:11:22.608000             🧑  作者: Mango

相关系数公式

相关系数是用来衡量两个变量之间的线性关系的一种统计量。 在实际应用中,我们经常需要计算相关系数来分析数据之间的关系。

Pearson相关系数公式

Pearson相关系数也称为线性相关系数,它衡量两个连续变量之间的线性关系。 其公式如下:

$\rho = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n (x_i - \bar{x})^2} \sqrt{\sum_{i=1}^n (y_i - \bar{y})^2}}$

其中,$\rho$为Pearson相关系数,$x_i$和$y_i$分别为第$i$个样本点的两个变量的取值,$\bar{x}$和$\bar{y}$为两个变量的样本均值,$n$为样本大小。

Spearman相关系数公式

Spearman相关系数也称为排序相关系数,用于衡量两个变量之间的monotonic关系(无论是正相关还是负相关)。 其公式如下:

$\rho = 1 - \frac{6\sum_{i=1}^n d_i^2}{n(n^2 - 1)}$

其中,$\rho$为Spearman相关系数,$d_i$为第$i$对排名之差,$n$为样本大小。

Kendall相关系数公式

Kendall相关系数也称为tau系数,用于衡量两个变量之间的等级关系(无论是正相关还是负相关)。 其公式如下:

$\tau = \frac{(P-Q)}{(P+Q+T)}$

其中,$\tau$为Kendall相关系数,$P$为匹配对的个数,$Q$为不匹配对的个数,$T$为一个特殊的统计量。

统计软件中的应用

在统计软件中,相关系数经常用于探索两个或多个变量之间的关系,并在建模过程中用于选择最佳预测变量。 在R中,我们可以使用cor函数来计算Pearson、Spearman和Kendall相关系数。

# 计算两个向量之间的Pearson相关系数
cor(x, y, method = "pearson")
# 计算两个向量之间的Spearman相关系数
cor(x, y, method = "spearman")
# 计算两个向量之间的Kendall相关系数
cor(x, y, method = "kendall")

其他统计软件如Python、MATLAB、SPSS等也都提供了计算相关系数的函数。