📅  最后修改于: 2021-01-23 06:41:35             🧑  作者: Mango
分布的拖尾程度通过峰度来衡量。它告诉我们,分布在多大程度上比正态分布更容易出现离群值(较重或较轻)。三种不同类型的曲线,由Investopedia提供,如下所示-
从密度图(左图)很难识别出不同类型的峰度,因为所有分布的尾部都接近于零。但是在正常的分位数-分位数图中(右图)很容易看到尾部的差异。
法线曲线称为中曲曲线。如果分布的曲线比正态或中速曲线更倾向于离群(或更重尾),则将其称为瘦角曲线。如果一条曲线比正常曲线更不离群(或更不规则),则称其为扁平肺曲线。峰度通过力矩来衡量,并由以下公式给出-
$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $
哪里-
$ {\ mu_4 = \ frac {\ sum(x- \ bar x)^ 4} {N}} $
\ beta_2的值越大,曲线的峰或峰越小。正态曲线的值为3,瘦足动物的\ beta_2大于3,而扁平肺动物的\ beta_2小于3。
问题陈述:
给出了一家工厂45名工人的日工资数据。使用关于均值的矩计算\ beta_1和\ beta_2。对结果发表评论。
Wages(Rs.) | Number of Workers |
---|---|
100-200 | 1 |
120-200 | 2 |
140-200 | 6 |
160-200 | 20 |
180-200 | 11 |
200-200 | 3 |
220-200 | 2 |
解:
Wages (Rs.) |
Number of Workers (f) |
Mid-pt m |
m-${\frac{170}{20}}$ d |
${fd}$ | ${fd^2}$ | ${fd^3}$ | ${fd^4}$ |
---|---|---|---|---|---|---|---|
100-200 | 1 | 110 | -3 | -3 | 9 | -27 | 81 |
120-200 | 2 | 130 | -2 | -4 | 8 | -16 | 32 |
140-200 | 6 | 150 | -1 | -6 | 6 | -6 | 6 |
160-200 | 20 | 170 | 0 | 0 | 0 | 0 | 0 |
180-200 | 11 | 190 | 1 | 11 | 11 | 11 | 11 |
200-200 | 3 | 210 | 2 | 6 | 12 | 24 | 48 |
220-200 | 2 | 230 | 3 | 6 | 18 | 54 | 162 |
${N=45}$ | ${\sum fd = 10}$ | ${\sum fd^2 = 64}$ | ${\sum fd^3 = 40}$ | ${\sum fd^4 = 330}$ |
由于偏差是取自假设均值的,因此我们首先计算关于任意原点的矩,然后计算关于均值的矩。关于任意起源’170’的时刻
通过关于均值的运动值,我们现在可以计算$ {\ beta_1} $和$ {\ beta_2} $:
从以上计算可以得出结论,测量偏斜度的$ {\ beta_1} $几乎为零,从而表明分布几乎是对称的。 $ {\ beta_2} $测量峰度,其值大于3,因此暗示该分布是瘦小体的。