📜  如何计算 R 中的偏相关?

📅  最后修改于: 2022-05-13 01:54:54.403000             🧑  作者: Mango

如何计算 R 中的偏相关?

在本文中,我们将讨论如何在 R 编程语言中计算偏相关。

当存在控制它们的其他变量的影响时,偏相关有助于衡量两个随机变量之间的关联程度。它基本上给出了两个随机变量与也影响它们的其他变量的影响之间的精确关系。

为了计算 R 语言中的偏相关,我们使用 ppcor 包库的 pcor()函数。 ppcor 包库帮助我们计算部分和半部分相关性以及 p 值。 pcor()函数帮助我们计算给定其他变量的每对变量的成对偏相关。它还为我们提供了每对变量的 p 值和统计量。

要使用 pcor()函数,我们首先需要安装 ppcor 包库。要安装 ppcor 库,我们使用

install.packages("ppcor")

安装后,我们可以使用 library()函数加载 ppcor 库。然后使用以下语法计算 R 语言中的偏相关。

示例:与数据框的两列部分相关的基本示例。

R
# create sample data frame
sample_data <- data.frame( x= c(1,2,3,4,5,6,7,7,7,8),
                           y= c(4,5,6,7,8,9,9,9,10,10))
  
# load library ppcor
library(ppcor)
  
# calculate Partial Correlation
pcor( sample_data )


R
# create sample data frame
sample_data <- data.frame( x= c(1,2,3,4,5,6,7,7,7,8),
                           y= c(4,5,6,7,8,9,9,9,10,10),
                           z= c(1,3,5,7,9,11,13,15,17,19))
  
# load library ppcor
library(ppcor)
  
# calculate Partial Correlation
pcor( sample_data )


输出:

$estimate
         x         y
x 1.0000000 0.9854592
y 0.9854592 1.0000000
$p.value
            x            y
x 0.000000e+00 1.921901e-07
y 1.921901e-07 0.000000e+00
$statistic
        x        y
x  0.00000 16.40436
y 16.40436  0.00000
$n
[1] 10
$gp
[1] 0
$method
[1] "pearson"

这里x和y的偏相关值为0.9854592,说明x和y高度一致,并且相互增加。

示例:与数据框的三列部分相关的基本示例。

R

# create sample data frame
sample_data <- data.frame( x= c(1,2,3,4,5,6,7,7,7,8),
                           y= c(4,5,6,7,8,9,9,9,10,10),
                           z= c(1,3,5,7,9,11,13,15,17,19))
  
# load library ppcor
library(ppcor)
  
# calculate Partial Correlation
pcor( sample_data )

输出:

$estimate
         x          y          z
x 1.0000000 0.76314445 0.58810321
y 0.7631444 1.00000000 0.05552034
z 0.5881032 0.05552034 1.00000000
$p.value
          x          y          z
x 0.00000000 0.01673975 0.09578687
y 0.01673975 0.00000000 0.88718502
z 0.09578687 0.88718502 0.00000000
$statistic
        x         y         z
x 0.000000 3.1244245 1.9238403
y 3.124425 0.0000000 0.1471199
z 1.923840 0.1471199 0.0000000
$n
[1] 10
$gp
[1] 1
$method
[1] "pearson"

这里,当 x 和 y 向量仍然相同时,x 和 y 之间的偏相关值与上面的示例不同,因为 z 向量正在影响它们。所以现在相关值从 0.9854592 下降到 0.76314445,因为 x 和 z 与 0.58810321 的值不一致。