📜  统计-Kolmogorov Smirnov检验

📅  最后修改于: 2021-01-23 06:41:11             🧑  作者: Mango


该测试用于必须比较观察到的样本分布和理论分布之间的情况。

KS一次样品测试

该测试用作拟合优度的测试,当样品尺寸较小时,它是理想的选择。它将具有指定分布的变量的累积分布函数进行比较。零假设假设观察到的分布与理论分布之间没有差异,并且检验统计量“ D”的值计算如下:

$ D =最大值| F_o(X)-F_r(X)| $

哪里-

  • $ {F_o(X)} $ = n个观测值的随机样本的观测累积频率分布。

  • 和$ {F_o(X)= \ frac {k} {n}} $ =(观察数≤X)/(观察总数)。

  • $ {F_r(X)} $ =理论频率分布。

从一个样本测试的KS表值中找到$ {D} $的临界值。

接受标准:如果计算值小于临界值,则接受无效假设。

拒绝标准:如果计算值大于表值,则拒绝原假设。

问题陈述:

在对来自大学不同流派的一项研究中,我们采访了60名学生,每个流派的学生人数均相等,我们对此进行了采访,并指出了他们加入大学戏剧俱乐部的意图。

  B.Sc. B.A. B.Com M.A. M.Com
No. in each class 5 9 11 16 19

预计每个班级会有12名学生加入戏剧俱乐部。使用KS检验来发现学生班级之间是否有加入戏剧俱乐部的意图的差异。

解:

$ {H_o} $:不同类型的学生加入戏剧俱乐部的意图没有差异。

我们为观察和理论分布开发了累积频率。

Streams No. of students interested in joining ${F_O(X)}$ ${F_T(X)}$ ${|F_O(X)-F_T(X)|}$
  Observed
(O)
Theoretical
(T)
     
B.Sc. 5 12 5/60 12/60 7/60
B.A. 9 12 14/60 24/60 10/60
B.COM. 11 12 25/60 36/60 11/60
M.A. 16 12 41/60 48/60 7/60
M.COM. 19 12 60/40 60/60 60/60
Total n=60        

测试统计量$ {| D |} $的计算公式为:

$ D =最大值{| F_0(X)-F_T(X)|} \\ [7pt] \,= \ frac {11} {60} \\ [7pt] \,= 0.183 $

D在显着性水平为5%时的表值如下

$ {D_0.05 = \ frac {1.36} {\ sqrt {n}}} \\ [7pt] \,= \ frac {1.36} {\ sqrt {60}} \\ [7pt] \,= 0.175 $

由于计算的值大于临界值,因此我们拒绝零假设,并得出结论,不同流的学生加入俱乐部的意图有所不同。

KS两样品测试

当有两个独立样本而不是一个样本时,则可以使用KS两个样本检验来检验两个累积分布之间的一致性。零假设表明两个分布之间没有差异。 D统计量的计算方法与KS One Sample Test(KS One Sample Test)相同。

$ {D =最大值| {F_n} _1(X)-{F_n} _2(X)|} $

哪里-

  • $ {n_1} $ =来自第一个样本的观察值。

  • $ {n_2} $ =来自第二个样本的观察值。

可以看出,当累积分布显示出较大的最大偏差$ {| D |} $时,表明两个样本分布之间存在差异。

对于$ {n_1 = n_2} $且≤40的样本的D临界值,使用两个样本案例的KS表。当$ {n_1} $和/或$ {n_2} $> 40时,应使用两个样本测试的大样本的KS表。如果计算值小于表值,则接受零假设,反之亦然。

因此,当目标人群的特征未知或未对其做出任何假设时,使用这些非参数检验中的任何一项都有助于研究人员检验其结果的重要性。