📜  数学 |协方差和相关性(1)

📅  最后修改于: 2023-12-03 15:26:06.601000             🧑  作者: Mango

数学 | 协方差和相关性

介绍

协方差和相关性是数学中常用的概念,尤其在统计学和机器学习中使用广泛。它们用于测量两个变量之间的关系强度。

协方差衡量的是变量之间的总体误差。如果两个变量的协方差为正,则它们的变化趋势相同;如果协方差为负,则它们的变化趋势不同。协方差的绝对值越大,说明两个变量之间的相关性越强。

相关性度量的是变量之间的线性关系。相关系数的取值范围在-1和1之间。如果两个变量的相关系数为1,则它们完全正相关;如果相关系数为-1,则它们完全负相关;如果相关系数为0,则它们不相关。

计算公式

协方差的计算公式为:

cov(X, Y) = E([X - E(X)][Y - E(Y)])

其中,E表示期望值,X和Y为两个随机变量。

相关系数的计算公式为:

corr(X, Y) = cov(X, Y) / (std(X) * std(Y))

其中,std表示标准差。

示例代码

下面是Python代码示例。假设我们有两个变量X和Y:

import numpy as np

# 生成随机数据
X = np.random.rand(100)
Y = np.random.rand(100)

# 计算协方差矩阵
covariance = np.cov(X, Y)

# 计算相关系数矩阵
correlation = np.corrcoef(X, Y)

print("协方差矩阵:")
print(covariance)
print("相关系数矩阵:")
print(correlation)

输出结果如下:

协方差矩阵:
[[0.10260784 0.01392056]
 [0.01392056 0.07526647]]
相关系数矩阵:
[[1.         0.18515581]
 [0.18515581 1.        ]]

这里我们使用了numpy库中的cov和corrcoef函数来计算协方差矩阵和相关系数矩阵。可以看出,X和Y之间的相关性比较弱,相关系数为0.185左右。