📜  R-多元回归(1)

📅  最后修改于: 2023-12-03 15:19:41.186000             🧑  作者: Mango

R-多元回归介绍

多元回归是一种常见的统计分析方法,可用于研究多个自变量对一个因变量的影响关系。在 R 中,我们可以使用 lm() 函数来进行多元回归分析。

基本语法
model <- lm(formula, data)

其中,formula 是一个公式对象,用于指定因变量与自变量之间的关系。data 是一个数据框,包含因变量和自变量的数据。

例如,我们要研究汽车价格与压缩比、马力和重量之间的关系,可以使用以下的公式:

formula <- price ~ compression_ratio + horsepower + weight

然后,我们可以使用以下的代码来构建模型:

model <- lm(formula, data = cars)

其中,cars 是一个数据框,包含汽车价格、压缩比、马力和重量等变量。

模型解释

我们可以使用 summary() 函数来查看模型的摘要信息,包括拟合结果、模型系数、标准误差、置信区间等等。

summary(model)

输出如下:

Call:
lm(formula = formula, data = cars)

Residuals:
    Min      1Q  Median      3Q     Max 
-31.839  -4.568  -0.614   4.735  37.452 

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)         -2.75e+03   1.31e+03  -2.095   0.0368 *  
compression_ratio    2.84e+00   5.12e-01   5.546 5.02e-08 ***
horsepower           1.43e+00   1.48e-01   9.657  < 2e-16 ***
weight               1.82e+00   2.63e-01   6.904 7.08e-11 ***
---

Residual standard error: 7.263 on 387 degrees of freedom
Multiple R-squared:  0.698,	Adjusted R-squared:  0.6955 
F-statistic: 245.6 on 3 and 387 DF,  p-value: < 2.2e-16

在摘要信息中,我们可以看到模型系数的估计值、标准误差、t 值、p 值等信息。同时还包括多个评估指标,例如拟合优度、调整拟合优度、F 统计量等。

预测

构建了线性回归模型以后,我们可以使用 predict() 函数来进行预测,预测的输入数据可以是一个新的数据框,也可以是原数据中的观测值。

new_data <- data.frame(compression_ratio = 9.2, horsepower = 120, weight = 3100)
predict(model, new_data)

输出如下:

       1 
12114.26 

预测结果为 12114.26,即压缩比为 9.2 的车辆,马力为 120,重量为 3100 的汽车的价格预测值为 12114.26。

结论

多元线性回归是一种常用的分析工具,它可以用来研究多个自变量对一个因变量的影响关系。在 R 中,我们可以使用 lm() 函数进行多元回归分析,使用 summary() 函数查看模型摘要信息,使用 predict() 函数进行预测。