📜  莱文测试

📅  最后修改于: 2021-08-25 10:56:23             🧑  作者: Mango

Levene检验用于评估两个不同样本之间方差的相等性。对于每种情况,它都会计算该情况的值与其单元均值之间的绝对差,并对这些差执行单向方差分析(ANOVA)

假设条件

  • 来自所考虑人群的样本是独立的。
  • 所考虑的人口大致呈正态分布。

如何进行Levene的测试

  • Levene检验的零假设是各组之间的方差相等。

H_0 : \sigma_{1}^{2} = \sigma_{2}^{2} = \sigma_{3}^{2} ...  = \sigma_{n}^{2}

  • 另一种假设是,不同组之间的方差不相等(对于至少一对,方差不等于其他方差)。

H_A :  \sigma_{1}^{2} \neq \sigma_{2}^{2} \neq \sigma_{3}^{2} ...  \neq \sigma_{n}^{2}

  • 莱文测试的测试统计数据是:

W = \frac{\left ( N - k \right )\sum_{i=1}^{K}N_{i} \left ( Z_{i} - Z.. \right )^2}{ \left ( K-1 \right )\sum_{i=1}^{K} \sum_{j=1}^{N_i}\left ( Z_{ij}- Z_i \right )^2}

  • 在哪里,
    • k:样本案例所属的不同组的数量。
    • N i :不同组中元素的数量。
    • N:所有组中的病例总数

Z_{ij} = \begin{Bmatrix} \left | Y_{ij} - \bar{Y_i} \right |, \bar{Y_i} \, is \, the \, mean \, of \, the \, i^{th} \, group \\ \left | Y_{ij} - \tilde{Y_i} \right |, \tilde{Y_i} \, is \, the \, median \, of \, the \, i^{th} \, group \end{Bmatrix}

  • 在哪里,
    • Y ij :第j案例和i个群组的值。

Z_i. = \frac{1}{N_i}\sum_{j=1}^{N_i}Z_{ij} \, where \, Z_{ij} \,is \, the\, mean \, of \, for \, group \, i
Z_{..} = \frac{1}{N_i}\sum_{i=1}^{K}\sum_{j=1}^{N_i}Z_{ij} \, where \, Z_{ij} \,is \, the\, mean \, of \, all.

  • Levene的统计信息有3种类型
    • 如果像柯西分布这样的分布具有更长的尾部分布,则我们使用修整后的均值。
    • 对于偏斜分布,如果分布不明确,我们将使用中位数进行检验统计。
    • 对于对称分布和中尾分布,我们使用平均值进行分布。
  • 确定重要性级别(alpha)。通常,我们将其取为0.05。
  • 在F分布表中找到给定显着性水平,(Nk)和(k-1)参数的临界值。
    • 如果W> F ∝,k-1,Nk,则我们拒绝原假设。
    • 否则,我们不会拒绝原假设。

例子:

  • 假设有2组学生在数学测试中包含他们的分数,如下所示:
Group 1 Group 2
14 34
34 36
16 44
43 18
45 42
36 39
42 16
43 35
16 15
27 33
  • 在这里,我们的原假设被定义为:

H_0 : \sigma_{1}^{2} = \sigma_{2}^{2}

  • 另一个假设是

H_A : \sigma_{1}^{2} \neq \sigma_{2}^{2}

  • 我们的重要程度是:

\alpha = 0.05

  • 现在,使用上面的公式计算测试统计量
  Group 1 Group 2 G1 (Y) : (Xi – Mean) G2 (Z) : (Xi – Mean) (Yi– meanVar)2 (Zi– meanVar)2
  14 34 2.8 17.6 49 60.84
  34 36 4.8 2.4 25 54.76
  16 44 12.8 15.6 9 33.64
  43 18 13.2 11.4 11.56 2.56
  45 42 10.8 13.4 1 12.96
  36 39 7.8 4.4 4 29.16
  42 16 15.2 10.4 29.16 0.36
  43 35 3.8 11.4 36 2.56
  16 15 16.2 15.6 40.96 33.64
  27 33 1.8 4.6 64 27.04
Average 31.6 31.2 8.92 10.68    
  • 其中,meanVar是,

meanVar = \frac{10 * 8.92 + 10 * 10.68}{20}

  • 和k-1 =组-1的数量= 1
  • Nk = 20-2 = 18。
  • 通过使用以下参数求解测试统计信息

W = \frac{18* 15.488}{1* 511.712}
W = 0.54481

  • 由于W 0.05,1,19 ,因此我们不拒绝原假设。

放大方式:

from scipy.stats import levene
# define groups
group_1 = [14, 34, 16, 43, 45, 36, 42, 43, 16, 27]
group_2 = [34, 36, 44, 18, 42, 39, 16, 35, 15, 33]
  
# define alpha
alpha =0.05 
# now we pass the groups and center value from the following
# ('trimmed mean', 'mean', 'median')
w_stats, p_value =levene(group_1,group_2, center ='mean')
  
if p_value > alpha :
  print("We do not reject the null hypothesis")
else:
  print("Reject the Null Hypothesis")
We do not reject the null hypothesis