📅  最后修改于: 2023-12-03 14:52:01.648000             🧑  作者: Mango
交互是指不同变量之间的相互影响。在回归分析中,经常需要考虑变量之间的交互作用。本篇文章将介绍如何使用 R 编程在回归中包含交互。
在 R 中,可以使用 lm
函数进行基础的回归分析。例如,以下代码演示了如何对 mtcars
数据集中的 mpg
油耗变量与 wt
重量变量进行回归分析。
# 导入数据
data(mtcars)
# 回归分析
model <- lm(mpg ~ wt, data = mtcars)
summary(model)
以上代码输出此次回归分析的摘要统计信息。
Call:
lm(formula = mpg ~ wt, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-4.5432 -2.3647 -0.1252 1.4096 6.8727
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
wt -5.3445 0.5591 -9.559 1.29e-10 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.046 on 30 degrees of freedom
Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
可以看到,这个回归模型使用 "mpg ~ wt"
作为公式,其中 mpg
是因变量,wt
是自变量之一。其余的是摘要统计信息,包括截距、回归系数、标准误、t 值、P 值等等。
在回归中加入交互项的方法是在公式中添加 "x1:x2"
。例如,以下代码演示了如何对 mtcars
数据集中的 mpg
油耗变量、wt
重量变量和 hp
马力变量进行回归分析,并将 wt
和 hp
的交互项包含在公式中。
# 回归分析
model2 <- lm(mpg ~ wt + hp + wt:hp, data = mtcars)
summary(model2)
以上代码也输出了摘要统计信息。其中,回归公式为 "mpg ~ wt + hp + wt:hp"
,其中加号表示对 wt
与 hp
进行相加的结果。交互项 wt:hp
的系数为该回归分析中的重点。
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 38.75365 2.58748 14.972 < 2e-16 ***
wt -3.16698 1.14602 -2.762 0.01081 *
hp -0.01855 0.01449 -1.280 0.21101
wt:hp -0.01912 0.01519 -1.259 0.21771
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.032 on 28 degrees of freedom
Multiple R-squared: 0.8269, Adjusted R-squared: 0.8083
F-statistic: 44.53 on 3 and 28 DF, p-value: 5.807e-10
对上述结果进行细读,我们发现 wt:hp
交互项的系数值为 -0.01912
。
在回归分析中包含交互项是一种常见但有挑战性的方法。本篇文章示范了如何使用 R 编程在回归中包含交互项。回归系数 wt:hp
不仅可以检查重要因素间的相互作用,还可以为之后的分析和预测提供有价值的信息。