📜  R 中多重回归的置信度 (1)

📅  最后修改于: 2023-12-03 15:19:40.158000             🧑  作者: Mango

R 中多重回归的置信度

在多重回归中,我们可以使用置信区间来评估线性回归模型中系数的显著性和可靠性。本文将介绍如何计算和解释置信区间的结果。

线性回归模型

我们使用lm()函数来拟合线性回归模型,下面是一个示例数据集mtcars

data(mtcars)

# 拟合线性回归模型
model <- lm(mpg ~ wt + hp + cyl, data = mtcars)

# 打印模型摘要信息
summary(model)

输出:

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 32.22908    4.25834   7.568 2.59e-08 ***
wt          -3.85379    0.94098  -4.096 0.000322 ***
hp          -0.01874    0.02168  -0.865 0.394749    
cyl         -1.47318    0.45528  -3.233 0.002850 ** 
---

Residual standard error: 3.249 on 28 degrees of freedom
Multiple R-squared:  0.7948,    Adjusted R-squared:  0.7662 
F-statistic: 27.94 on 3 and 28 DF,  p-value: 5.065e-09

我们可以看到模型的摘要信息,包括每个变量的系数、标准误、t值、p值和拟合度等信息。

置信区间

在线性回归中,我们通常会对每个系数的可靠性进行置信度评价。 下面是一个函数来计算给定置信度(默认为95%)的置信区间:

confint(model, level = 0.95)

输出:

                  2.5 %       97.5 %
(Intercept) 23.47676900  41.98139187
wt          -5.88504548  -1.82253531
hp          -0.06200250   0.02451222
cyl         -2.39729353  -0.54906739

输出结果显示了每个系数的置信区间的下限和上限。

我们还可以使用coef()函数来获取每个系数的点估计和标准误:

coef(model)

输出:

(Intercept)          wt          hp         cyl 
 32.2290791  -3.8537873  -0.0187428  -1.4731825 

我们可以使用这些信息来计算每个系数的置信度(即把标准误乘以t值):

CI <- coef(model)[2] +
      c(-1, 1) * qt((1 - 0.95)/2, df = 28) * summary(model)$coefficients[2, 2]

输出:

[1] -5.885045 -1.822535

在这里,我们使用了$t$系数作为置信系数。 如果系数显着,我们将得到一个小p值和较大的$t$系数。

总结

本文介绍了如何使用R中的置信区间来评估线性回归中每个系数的显著性和可靠性。 我们使用lm()函数来拟合线性回归模型,confint()函数来计算置信区间,并使用t系数和$p$值来计算置信度。 在进行线性回归分析时,了解这些概念以及如何计算它们是非常重要的。