📅  最后修改于: 2023-12-03 15:23:57.382000             🧑  作者: Mango
在回归分析中,我们通常需要考虑多个因素对目标变量的影响。R 语言提供了多种方法来实现多因素回归分析,本文将介绍其中一种方法:多元线性回归。
多元线性回归是一种基于线性模型的回归分析方法。其目标是建立一个关于多个自变量的线性模型来预测因变量的值。在 R 语言中,我们可以使用 lm()
函数进行多元线性回归分析。
以下代码示例将使用 mtcars
数据集进行多元线性回归分析。该数据集包含了 1974 年 21 种不同品牌的汽车的燃油效率和其他相关变量的数据。
# 加载数据集
data(mtcars)
# 构建多元线性回归模型
model <- lm(mpg ~ cyl + disp + hp + wt, data = mtcars)
# 输出回归分析结果
summary(model)
在上述代码中,lm()
函数的第一个参数为因变量 mpg
,第二个参数为多个自变量 cyl
、disp
、hp
和 wt
。data
参数用于指定数据集名称。
summary()
函数用于输出回归分析结果。输出结果中包含了回归系数、截距、多重 R 方值和 P 值等信息。
在回归模型中,多重 R 方值表示模型对方差的解释程度,越接近 1 表示模型越拟合数据。在本例中,多重 R 方值为 0.8498,说明该模型可以解释 84.98% 的方差。
下图展示了自变量 wt
对因变量 mpg
的回归关系。
# 绘制散点图和回归线
plot(mtcars$wt, mtcars$mpg,
main = "Regression of mpg on wt",
xlab = "Weight (lb/1000)",
ylab = "Miles per gallon (mpg)",
pch = 16)
abline(model$coefficients[1], model$coefficients[2], col = "red")
在上图中,圆点表示 mtcars
数据集中不同汽车的数据,红线表示回归线。可以看到,重量 wt
与燃油效率 mpg
之间呈现出倒 U 形曲线关系,随着汽车重量的增加,燃油效率降低。
本文介绍了使用 R 语言进行多元线性回归分析的方法,包括构建模型、输出回归分析结果和解读回归线等。通过多元线性回归分析,我们可以更准确地预测目标变量的值,并且可以了解多个自变量对目标变量的影响程度。