📜  统计-残差分析

📅  最后修改于: 2021-01-23 06:52:00             🧑  作者: Mango


残差分析用于通过定义残差并检查残差图来评估线性回归模型的适用性。

剩余的

残差($ e $)是指观测值($ y $)与预测值($ \ hat y $)之间的差。每个数据点都有一个残差。

$ {剩余=观察值-预测值\\ [7pt] e = y-\ hat y} $

残留图

残差图是其中残差在垂直轴上而自变量在水平轴上的图。如果点围绕水平轴随机散布,则线性回归模型适用于该数据;否则,请选择非线性模型。

剩余图的类型

以下示例显示了残差图中的几种模式。

残留图

在第一种情况下,点是随机分散的。因此,线性回归模型是首选。在第二和第三种情况下,点是非随机分散的,这建议使用非线性回归方法。

问题陈述:

检查线性回归模型适合以下数据的位置。

$ x $ 60 70 80 85 95
$ y $ (Actual Value) 70 65 70 95 85
$ \hat y $ (Predicted Value) 65.411 71.849 78.288 81.507 87.945

解:

步骤1:计算每个数据点的残差。

$ x $ 60 70 80 85 95
$ y $ (Actual Value) 70 65 70 95 85
$ \hat y $ (Predicted Value) 65.411 71.849 78.288 81.507 87.945
$ e $ (Residual) 4.589 -6.849 -8.288 13.493 -2.945

步骤2: -绘制残差图。

残留图

步骤3: -检查残差的随机性。

在这里残差图显示一个随机模式-第一个残差为正,随后两个为负,第四个残差为正,最后一个残差为负。由于模式是相当随机的,这表明线性回归模型适用于上述数据。