📜  统计-峰度

📅  最后修改于: 2021-01-23 06:41:35             🧑  作者: Mango


分布的拖尾程度通过峰度来衡量。它告诉我们,分布在多大程度上比正态分布更容易出现离群值(较重或较轻)。三种不同类型的曲线,由Investopedia提供,如下所示-

峰度

从密度图(左图)很难识别出不同类型的峰度,因为所有分布的尾部都接近于零。但是在正常的分位数-分位数图中(右图)很容易看到尾部的差异。

法线曲线称为中曲曲线。如果分布的曲线比正态或中速曲线更倾向于离群(或更重尾),则将其称为瘦角曲线。如果一条曲线比正常曲线更不离群(或更不规则),则称其为扁平肺曲线。峰度通过力矩来衡量,并由以下公式给出-

$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $

哪里-

  • $ {\ mu_4 = \ frac {\ sum(x- \ bar x)^ 4} {N}} $

\ beta_2的值越大,曲线的峰或峰越小。正态曲线的值为3,瘦足动物的\ beta_2大于3,而扁平肺动物的\ beta_2小于3。

问题陈述:

给出了一家工厂45名工人的日工资数据。使用关于均值的矩计算\ beta_1和\ beta_2。对结果发表评论。

Wages(Rs.) Number of Workers
100-200 1
120-200 2
140-200 6
160-200 20
180-200 11
200-200 3
220-200 2

解:

Wages
(Rs.)
Number of Workers
(f)
Mid-pt
m
m-${\frac{170}{20}}$
d
${fd}$ ${fd^2}$ ${fd^3}$ ${fd^4}$
100-200 1 110 -3 -3 9 -27 81
120-200 2 130 -2 -4 8 -16 32
140-200 6 150 -1 -6 6 -6 6
160-200 20 170 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 12 24 48
220-200 2 230 3 6 18 54 162
  ${N=45}$     ${\sum fd = 10}$ ${\sum fd^2 = 64}$ ${\sum fd^3 = 40}$ ${\sum fd^4 = 330}$

由于偏差是取自假设均值的,因此我们首先计算关于任意原点的矩,然后计算关于均值的矩。关于任意起源’170’的时刻

$ {\ mu_1 ^ 1 = \ frac {\ sum fd} {N} \ times i = \ frac {10} {45} \ times 20 = 4.44 \\ [7pt] \ mu_2 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ times i ^ 2 = \ frac {64} {45} \ times 20 ^ 2 = 568.88 \\ [7pt] \ mu_3 ^ 1 = \ frac {\ sum fd ^ 2} {N} \时间i ^ 3 = \ frac {40} {45} \ times 20 ^ 3 = 7111.11 \\ [7pt] \ mu_4 ^ 1 = \ frac {\ sum fd ^ 4} {N} \ times i ^ 4 = \ frac {330} {45} \ times 20 ^ 4 = 1173333.33} $

关于均值的时刻

$ {\ mu_2 = \ mu’_2-(\ mu’_1)^ 2 = 568.88-(4.44)^ 2 = 549.16 \\ [7pt] \ mu_3 = \ mu’_3-3(\ mu’_1)(\ mu’_2)+ 2(\ mu’_1)^ 3 \\ [7pt] \,= 7111.11-(4.44)(568.88)+ 2(4.44)^ 3 \\ [7pt] \,= 7111.11-7577.48 + 175.05 =-291.32 \\ [7pt] \\ [7pt] \ mu_4 = \ mu’_4-4(\ mu’_1)(\ mu’_3)+ 6(\ mu_1)^ 2(\ mu’_2)-3 (\ mu’_1)^ 4 \\ [7pt] \,= 1173333.33-4(4.44)(7111.11)+6(4.44)^ 2(568.88)-3(4.44)^ 4 \\ [7pt] \,= 1173333.33-126293.31 + 67288.03-1165.87 \\ [7pt] \,= 1113162.18} $

通过关于均值的运动值,我们现在可以计算$ {\ beta_1} $和$ {\ beta_2} $:

$ {\ beta_1 = \ mu ^ 2_3 = \ frac {(-291.32)^ 2} {(549.16)^ 3} = 0.00051 \\ [7pt] \ beta_2 = \ frac {\ mu_4} {(\ mu_2)^ 2 } = \ frac {1113162.18} {(546.16)^ 2} = 3.69} $

从以上计算可以得出结论,测量偏斜度的$ {\ beta_1} $几乎为零,从而表明分布几乎是对称的。 $ {\ beta_2} $测量峰度,其值大于3,因此暗示该分布是瘦小体的。