📜  德宾沃森测试

📅  最后修改于: 2022-05-13 01:58:07.725000             🧑  作者: Mango

德宾沃森测试

Durbin Watson 检验:由统计学家 James Durbin 教授和 Geoffrey Stuart Watson 开发的检验用于检测回归分析中残差的自相关。它通常被称为 Durbin-Watson d 统计量,其定义为

$d=\frac{\sum_{t=2}^{t=n}\left(u_{t}-u_{t-1}\right)^{2}}{\sum_{t=1}^{t=n} u_{t}^{2}}$

让我们先看一些术语来有一个清晰的理解——

  • 回归分析——回归分析是一组统计方法,用于估计因变量 ( Y ) 和一个或多个自变量 ( x ) 之间的关系。这种方法有助于确定哪些因素对结果的影响最大,并且绝对应该参与实验,哪些因素可以忽略。
  • 残差 -它是计算/观察值与特定观察值的预测值之间的差异。这里残差由u表示。
  • 自相关——自相关表示给定时间序列与其自身在连续时间间隔内的滞后版本之间的相似程度。自相关测量变量的当前值与其过去值之间的关系。例如 — 计算一个月中所有天的气温值,观察到第 1 天的值与第 2 天的值比第 30 天的值更相似。因此,数据被认为是自相关的,因为在时间上更近观察到的值比在更远距离上观察到的值更相似。

Durbin-Watson d 检验的假设

  • 误差呈正态分布,均值为 0。
  • 误差是平稳的。

Durbin-Watson d 检验的原假设和替代假设



  • 零假设:一阶自相关不存在。
  • 替代假设:存在一阶自相关。

制定上述假设是为了检查自相关,它可以是正的也可以是负的。我们还可以检查是否存在正自相关和负自相关。将相应地制定假设。

Durbin-Watson d 检验的检验统计量

$d=\frac{\sum_{t=2}^{t=n}\left(u_{t}-u_{t-1}\right)^{2}}{\sum_{t=1}^{t=n} u_{t}^{2}}$
ut = the residual value for the tth observation.
u = Yactual - Ycalculated
number of observations in the experiment.
d = the ratio of the sum of squared differences in successive
 residuals to the Residual 
Sum of Squares(RSS).

分析 Durbin-Watson d 统计量

d 的值总是介于 0 和 4 之间。如果 d 接近 2,则表示不存在自相关,我们接受原假设。我们找出给定数据的临界值d Ld U。 d L是下临界值, d U是上临界值。使用这些值,根据下面提到的决策规则检查自相关的存在 -

Testing for positive autocorrelation - 
d < dL = positive autocorrelation is present
d > dU = No positive autocorrelation
dL < d < dU = Test is inconclusive
 
Testing for positive autocorrelation - 
4-d < dL = negative autocorrelation is present
4-d > dU = No negative autocorrelation
dL < 4-d < dU = Test is inconclusive

根据这些规则,我们要么接受要么拒绝原假设。

执行 Durbin-Watson d 检验的步骤

让我们举一个例子来理解如何执行这个测试。



示例:使用英国的进口和 GNP 数据,通过应用 Durbin-Watson d-statistic 测试数据的自相关性。使用 5% 的显着性水平。

Imports (Y) 2.6 4.13.5 4.34.54.24.14.5 4.95.25.45.35.26.26.4
GNP (X)212222232424252525262829293032

步骤 1:运行回归分析并获得残差。

回归线由下式给出——

 $Y=\beta_{0}+\beta_{1} X$ where, $\beta_{0}=\frac{n \sum(X-\bar{X})(Y-\bar{Y})-\sum(X-\bar{X}) \sum(Y-\bar{Y})}{n \sum(X-\bar{X})^{2}-\left(\sum(X-\bar{X})\right)^{2}}$ and $\beta_{1}=\bar{Y}-\beta_{0} \bar{X}$
n = total number of observations.
Ā = mean value of A. Here A can be X or Y.

计算回归线的方程后,通过放置相应的X值得到相应的Y计算值。然后得到残差的值——

Residual(u) = Yactual - Ycalculated  for each observation

步骤 2:计算 d 的值。

现在输入所需的值并找到 d 的值。

对于给定的示例,d 的值为 1.89。

步骤 3:找出临界值 d L和 d U

对于给定的样本大小(n=15)和自变量的数量 k(在给定的示例中为 1),使用显着性表来查找值。



d L 的值为 1.077,d U 的值为 1.361。

步骤 4:按照上述决策规则得出结果。

有效的规则是——

d > dU   - No positive autocorrelation
4-d = 2.1 > dU - No negative autocorrelation.

第 5 步:总结结果

由于不存在正或负自相关,我们接受零假设。