📅  最后修改于: 2023-12-03 15:19:41.186000             🧑  作者: Mango
多元回归是一种常见的统计分析方法,可用于研究多个自变量对一个因变量的影响关系。在 R 中,我们可以使用 lm()
函数来进行多元回归分析。
model <- lm(formula, data)
其中,formula
是一个公式对象,用于指定因变量与自变量之间的关系。data
是一个数据框,包含因变量和自变量的数据。
例如,我们要研究汽车价格与压缩比、马力和重量之间的关系,可以使用以下的公式:
formula <- price ~ compression_ratio + horsepower + weight
然后,我们可以使用以下的代码来构建模型:
model <- lm(formula, data = cars)
其中,cars
是一个数据框,包含汽车价格、压缩比、马力和重量等变量。
我们可以使用 summary()
函数来查看模型的摘要信息,包括拟合结果、模型系数、标准误差、置信区间等等。
summary(model)
输出如下:
Call:
lm(formula = formula, data = cars)
Residuals:
Min 1Q Median 3Q Max
-31.839 -4.568 -0.614 4.735 37.452
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.75e+03 1.31e+03 -2.095 0.0368 *
compression_ratio 2.84e+00 5.12e-01 5.546 5.02e-08 ***
horsepower 1.43e+00 1.48e-01 9.657 < 2e-16 ***
weight 1.82e+00 2.63e-01 6.904 7.08e-11 ***
---
Residual standard error: 7.263 on 387 degrees of freedom
Multiple R-squared: 0.698, Adjusted R-squared: 0.6955
F-statistic: 245.6 on 3 and 387 DF, p-value: < 2.2e-16
在摘要信息中,我们可以看到模型系数的估计值、标准误差、t 值、p 值等信息。同时还包括多个评估指标,例如拟合优度、调整拟合优度、F 统计量等。
构建了线性回归模型以后,我们可以使用 predict()
函数来进行预测,预测的输入数据可以是一个新的数据框,也可以是原数据中的观测值。
new_data <- data.frame(compression_ratio = 9.2, horsepower = 120, weight = 3100)
predict(model, new_data)
输出如下:
1
12114.26
预测结果为 12114.26,即压缩比为 9.2 的车辆,马力为 120,重量为 3100 的汽车的价格预测值为 12114.26。
多元线性回归是一种常用的分析工具,它可以用来研究多个自变量对一个因变量的影响关系。在 R 中,我们可以使用 lm()
函数进行多元回归分析,使用 summary()
函数查看模型摘要信息,使用 predict()
函数进行预测。