📅  最后修改于: 2021-01-23 06:52:00             🧑  作者: Mango
残差分析用于通过定义残差并检查残差图来评估线性回归模型的适用性。
残差($ e $)是指观测值($ y $)与预测值($ \ hat y $)之间的差。每个数据点都有一个残差。
$ {剩余=观察值-预测值\\ [7pt] e = y-\ hat y} $
残差图是其中残差在垂直轴上而自变量在水平轴上的图。如果点围绕水平轴随机散布,则线性回归模型适用于该数据;否则,请选择非线性模型。
以下示例显示了残差图中的几种模式。
在第一种情况下,点是随机分散的。因此,线性回归模型是首选。在第二和第三种情况下,点是非随机分散的,这建议使用非线性回归方法。
问题陈述:
检查线性回归模型适合以下数据的位置。
$ x $ | 60 | 70 | 80 | 85 | 95 |
---|---|---|---|---|---|
$ y $ (Actual Value) | 70 | 65 | 70 | 95 | 85 |
$ \hat y $ (Predicted Value) | 65.411 | 71.849 | 78.288 | 81.507 | 87.945 |
解:
步骤1:计算每个数据点的残差。
$ x $ | 60 | 70 | 80 | 85 | 95 |
---|---|---|---|---|---|
$ y $ (Actual Value) | 70 | 65 | 70 | 95 | 85 |
$ \hat y $ (Predicted Value) | 65.411 | 71.849 | 78.288 | 81.507 | 87.945 |
$ e $ (Residual) | 4.589 | -6.849 | -8.288 | 13.493 | -2.945 |
步骤2: -绘制残差图。
步骤3: -检查残差的随机性。
在这里残差图显示一个随机模式-第一个残差为正,随后两个为负,第四个残差为正,最后一个残差为负。由于模式是相当随机的,这表明线性回归模型适用于上述数据。