📜  Sheppard 的片刻修正 |机器学习

📅  最后修改于: 2022-05-13 01:58:07.955000             🧑  作者: Mango

Sheppard 的片刻修正 |机器学习

先决条件:原始和中心时刻

我们假设在分组数据中频率集中在类间隔的中间部分。这个假设在一般情况下不成立,并且引入了分组错误。这种影响可以在计算矩时通过使用类间隔宽度的信息来纠正。

Sheppard's Correction for grouping error只不过是对分组数据或连续数据的计算样本矩的调整。 WF Sheppard 教授证明,如果频率分布是连续的,并且频率在两个方向上都逐渐减小到零,则可以按如下方式校正分组错误:

'c'是类间隔的宽度。然后,
原始时刻
\mu {}'_1_(_c_o_r_r) = \mu {}'_1
\mu {}'_2_(_c_o_r_r) = \mu {}'_2 - c^{2}/12
\mu {}'_3_(_c_o_r_r) = \mu {}'_3 - \mu {}'_1 * c^{2}/4
\mu {}'_4_(_c_o_r_r) = \mu {}'_4 - \mu {}'_2 * c^{2}/2 + c^{4} * 7/240

中心时刻
\mu {}_2_(_c_o_r_r) = \mu {}_2 - c^{2}/12
\mu {}_3_(_c_o_r_r) = \mu {}_3
\mu {}_4_(_c_o_r_r) = \mu {}_4 - \mu {}_2 * c^{2}/2 + c^{4} * 7/240



什么样的数据可以更正?

  1. 这种矩量校正方法仅适用于连续变量,即连续数据。
  2. 班级间隔的宽度应该相等。
  3. 频率应该是对称的。频率应该在两个方向上逐渐减小为零。

考虑给定的标记分布。

MarksNumber of Students
0 – 101
10 – 206
20 – 3011
30 – 4017
40 – 5021
50 – 6016
60 – 7013
70 – 807
80 – 905
90 – 1002

对于上述分数的分布,矩值如下:

原始时刻 –
 \mu {}'_r = \frac{1}{n}\sum_{i=1}^{n}f_i x_i^{r} , 是第 r 个原始时刻,其中f_i是频率计数和x_i是类的中间值。

因此,使用上述原始时刻的公式,我们得到以下时刻的值。
\mu {}'_1 = 48.23
\mu {}'_2 = 2711.87
\mu {}'_3 = 169751.26
\mu {}'_4 = 11515978.53

Sheppard 对 Raw Moments 的修正——

\mu {}'_1_(_c_o_r_r_) = \mu {}'_1 = 48.23
\mu {}'_2_(_c_o_r_r_) = 2703.53
\mu {}'_3_(_c_o_r_r_) = 168545.51
\mu {}'_4_(_c_o_r_r_) = 11380676.70

类似地,可以使用Sheppard's Correction校正中心矩。