📜  Levene 的测试

📅  最后修改于: 2021-09-22 10:48:06             🧑  作者: Mango

Levene 检验用于评估两个不同样本之间的方差相等性。对于每个案例,它计算该案例的值与其单元格平均值之间的绝对差异,并对这些差异执行单向方差分析 (ANOVA)

假设

  • 来自所考虑总体的样本是独立的。
  • 所考虑的总体大致呈正态分布。

如何执行 Levene 检验

  • Levene 检验的原假设是组间方差相等。

H_0 : \sigma_{1}^{2} = \sigma_{2}^{2} = \sigma_{3}^{2} ...  = \sigma_{n}^{2}

  • 备择假设是不同组之间的方差不相等(至少一对方差不等于其他组)。

H_A :  \sigma_{1}^{2} \neq \sigma_{2}^{2} \neq \sigma_{3}^{2} ...  \neq \sigma_{n}^{2}

  • Levene 检验的检验统计量是:

W = \frac{\left ( N - k \right )\sum_{i=1}^{K}N_{i} \left ( Z_{i} - Z.. \right )^2}{ \left ( K-1 \right )\sum_{i=1}^{K} \sum_{j=1}^{N_i}\left ( Z_{ij}- Z_i \right )^2}

  • 在哪里,
    • k:抽样案例所属的不同组的数量。
    • N i :不同组中的元素数。
    • N:所有组的病例总数

Z_{ij} = \begin{Bmatrix} \left | Y_{ij} - \bar{Y_i} \right |, \bar{Y_i} \, is \, the \, mean \, of \, the \, i^{th} \, group \\ \left | Y_{ij} - \tilde{Y_i} \right |, \tilde{Y_i} \, is \, the \, median \, of \, the \, i^{th} \, group \end{Bmatrix}

  • 在哪里,
    • Y ij :第 j案例和i 个组的值。

Z_i. = \frac{1}{N_i}\sum_{j=1}^{N_i}Z_{ij} \, where \, Z_{ij} \,is \, the\, mean \, of \, for \, group \, i    [Tex]Z_{..} = \frac{1}{N_i}\sum_{i=1}^{K}\sum_{j=1}^{N_i}Z_{ij} \,其中 \, Z_{ ij} \,is \, the\, mean \, of \, all. [/特克斯]

  • Levene 的统计数据共有三种类型
    • 如果分布具有更长的尾分布,如柯西分布,那么我们使用修剪均值。
    • 对于偏态分布,如果分布不明确,我们将使用中位数进行测试统计。
    • 对于对称分布和中尾分布,我们使用均值进行分布。
  • 确定显着性水平 (alpha)。一般我们取0.05。
  • 在 F 分布表中找到给定显着性水平 (Nk) 和 (k-1) 参数的临界值。
    • 如果 W > F ∝, k-1, Nk,那么我们拒绝原假设。
    • 否则,我们不拒绝原假设。

例子:

  • 假设有 2 组学生,他们的数学考试成绩如下:
Group 1 Group 2
14 34
34 36
16 44
43 18
45 42
36 39
42 16
43 35
16 15
27 33
  • 在这里,我们的原假设定义为:

H_0 : \sigma_{1}^{2} = \sigma_{2}^{2}

  • 替代假设是

H_A : \sigma_{1}^{2} \neq \sigma_{2}^{2}

  • 我们的重要性水平是:

\alpha = 0.05

  • 现在,使用上述公式计算测试统计量
  Group 1 Group 2 G1 (Y) : (Xi – Mean) G2 (Z) : (Xi – Mean) (Yi– meanVar)2 (Zi– meanVar)2
  14 34 2.8 17.6 49 60.84
  34 36 4.8 2.4 25 54.76
  16 44 12.8 15.6 9 33.64
  43 18 13.2 11.4 11.56 2.56
  45 42 10.8 13.4 1 12.96
  36 39 7.8 4.4 4 29.16
  42 16 15.2 10.4 29.16 0.36
  43 35 3.8 11.4 36 2.56
  16 15 16.2 15.6 40.96 33.64
  27 33 1.8 4.6 64 27.04
Average 31.6 31.2 8.92 10.68    
  • 其中,meanVar 是,

meanVar = \frac{10 * 8.92 + 10 * 10.68}{20}

  • 和 k-1 = 组数 -1 =1
  • Nk = 20-2 =18。
  • 通过使用以下参数求解测试统计量

W = \frac{18* 15.488}{1* 511.712}   [特克斯]W = 0.54481[/特克斯]

  • 由于 W < F 0.05,1,19 ,因此我们不拒绝原假设。

执行:

Python3
from scipy.stats import levene
# define groups
group_1 = [14, 34, 16, 43, 45, 36, 42, 43, 16, 27]
group_2 = [34, 36, 44, 18, 42, 39, 16, 35, 15, 33]
 
# define alpha
alpha =0.05
# now we pass the groups and center value from the following
# ('trimmed mean', 'mean', 'median')
w_stats, p_value =levene(group_1,group_2, center ='mean')
 
if p_value > alpha :
  print("We do not reject the null hypothesis")
else:
  print("Reject the Null Hypothesis")


We do not reject the null hypothesis