Levene 检验用于评估两个不同样本之间的方差相等性。对于每个案例,它计算该案例的值与其单元格平均值之间的绝对差异,并对这些差异执行单向方差分析 (ANOVA)
假设
- 来自所考虑总体的样本是独立的。
- 所考虑的总体大致呈正态分布。
如何执行 Levene 检验
- Levene 检验的原假设是组间方差相等。
- 备择假设是不同组之间的方差不相等(至少一对方差不等于其他组)。
- Levene 检验的检验统计量是:
- 在哪里,
- k:抽样案例所属的不同组的数量。
- N i :不同组中的元素数。
- N:所有组的病例总数
- 在哪里,
- Y ij :第 j个案例和第i 个组的值。
[Tex]Z_{..} = \frac{1}{N_i}\sum_{i=1}^{K}\sum_{j=1}^{N_i}Z_{ij} \,其中 \, Z_{ ij} \,is \, the\, mean \, of \, all. [/特克斯]
- Levene 的统计数据共有三种类型
- 如果分布具有更长的尾分布,如柯西分布,那么我们使用修剪均值。
- 对于偏态分布,如果分布不明确,我们将使用中位数进行测试统计。
- 对于对称分布和中尾分布,我们使用均值进行分布。
- 确定显着性水平 (alpha)。一般我们取0.05。
- 在 F 分布表中找到给定显着性水平 (Nk) 和 (k-1) 参数的临界值。
- 如果 W > F ∝, k-1, Nk,那么我们拒绝原假设。
- 否则,我们不拒绝原假设。
例子:
- 假设有 2 组学生,他们的数学考试成绩如下:
Group 1 | Group 2 |
---|---|
14 | 34 |
34 | 36 |
16 | 44 |
43 | 18 |
45 | 42 |
36 | 39 |
42 | 16 |
43 | 35 |
16 | 15 |
27 | 33 |
- 在这里,我们的原假设定义为:
- 替代假设是
- 我们的重要性水平是:
- 现在,使用上述公式计算测试统计量
Group 1 | Group 2 | G1 (Y) : (Xi – Mean) | G2 (Z) : (Xi – Mean) | (Yi– meanVar)2 | (Zi– meanVar)2 | |
---|---|---|---|---|---|---|
14 | 34 | 2.8 | 17.6 | 49 | 60.84 | |
34 | 36 | 4.8 | 2.4 | 25 | 54.76 | |
16 | 44 | 12.8 | 15.6 | 9 | 33.64 | |
43 | 18 | 13.2 | 11.4 | 11.56 | 2.56 | |
45 | 42 | 10.8 | 13.4 | 1 | 12.96 | |
36 | 39 | 7.8 | 4.4 | 4 | 29.16 | |
42 | 16 | 15.2 | 10.4 | 29.16 | 0.36 | |
43 | 35 | 3.8 | 11.4 | 36 | 2.56 | |
16 | 15 | 16.2 | 15.6 | 40.96 | 33.64 | |
27 | 33 | 1.8 | 4.6 | 64 | 27.04 | |
Average | 31.6 | 31.2 | 8.92 | 10.68 |
- 其中,meanVar 是,
- 和 k-1 = 组数 -1 =1
- Nk = 20-2 =18。
- 通过使用以下参数求解测试统计量
[特克斯]W = 0.54481[/特克斯]
- 由于 W < F 0.05,1,19 ,因此我们不拒绝原假设。
执行:
Python3
from scipy.stats import levene
# define groups
group_1 = [14, 34, 16, 43, 45, 36, 42, 43, 16, 27]
group_2 = [34, 36, 44, 18, 42, 39, 16, 35, 15, 33]
# define alpha
alpha =0.05
# now we pass the groups and center value from the following
# ('trimmed mean', 'mean', 'median')
w_stats, p_value =levene(group_1,group_2, center ='mean')
if p_value > alpha :
print("We do not reject the null hypothesis")
else:
print("Reject the Null Hypothesis")
We do not reject the null hypothesis