📅  最后修改于: 2021-01-07 01:51:25             🧑  作者: Mango
标准偏差是研究变异(离散)的最重要且使用最广泛的度量。它显示了数据的变化。标准偏差的计算有点复杂。错误的风险很高,因此我们需要高度重视和准确的计算。在本节中,我们将学习如何找到标准偏差。
标准偏差(SD)是一种量化方法,用于衡量数据集相对于其平均值的分布(分散)。计算为方差的平方根。用较低的希腊字母σ(sigma)表示。如果偏差较大,则色散将较大,而如果偏差较小,则均匀性也较大。
其他一些定义是:
它定义了一个随机变量与其期望值的差异。它是期望值和单个值之间差异的平方的平均值。它永远不会有负值。它是由σ2表示。方差公式为:
通过确定每个数据点之间相对于均值的变化,将其计算为方差的平方根。标准偏差越高,每个数据集和平均值之间的方差越大。
有两个公式可以计算标准偏差。这两个公式都可以测量变化。但是它们之间是有区别的。
它是一个参数,可以根据总体中的每个人计算出固定值。人口标准差的公式为:
哪里:
σ :人口标准偏差。
x i :数据中的每个元素
μ :数据集中所有元素的平均值。
N :元素数。
这是一个统计数据。在此标准偏差下,仅从人口中抽取一些个体进行计算。它具有更大的可变性,因为它取决于样本。因此,样本的标准偏差大于总体标准偏差。
样品标准偏差的公式为:
哪里:
s :样品标准偏差。
x i :数据集中的每个元素。其中i = 1,2,3,….,N.
x :数据集中所有元素的均值。
N :元素数。
现在,我们将看到这些标准偏差之间的差异。考虑样本和总体标准差公式;我们看到两个公式几乎相同。
步骤1:首先,计算平均值。对所有值求和,然后除以元素数。
步骤2:计算平均值的偏差。要达到相同目的,请从每个值中减去平均值。
步骤3:对偏差进行平方。
步骤4:将偏差平方并添加。
步骤5:将偏差平方除以观察次数。此步骤在总体标准偏差和样本标准偏差之间有很大的不同。
步骤6:找到在上一步中得到的商的平方根。
总体值和样本标准差取决于N。 N值越大,总体和样本标准偏差越大。
我们也可以使用直接方法找到标准偏差。当偏离实际均值时使用。直接方法的公式为:
哪里:
d =(x i – x )
σ :标准偏差
x i :数据集中的每个元素。其中i = 1,2,3,….,N.
x :数据集中所有元素的均值。
N :元素数。
在这种方法中,我们不计算实际均值。取而代之的是,我们选择一个随机值来计算偏差。假定值必须在中间值附近。也称为快捷方式。假定均值方法的公式为:
哪里,
f :对应频率
d = xA (假设A为平均值)
N :数据集中的元素数。
它是快捷方法的扩展形式。它简化了计算。假定均值方法的公式为:
哪里,
f :对应频率
d = (假设A为均值)
N :数据集中的元素数。
i :普通班间隔
在转向示例之前,我们必须了解三种分布类型。
Marks (x) | 55 | 34 | 78 | 58 | 90 | 67 | 81 |
Marks (x) | 65 | 86 | 58 | 45 | 88 | 90 | 35 |
No. of Students (f) | 5 | 7 | 12 | 8 | 4 | 2 | 1 |
Marks (x) | 20-30 | 30-40 | 40-50 | 50-60 | 60-70 | 70-80 | 80-90 |
No. of Students (f) | 6 | 8 | 14 | 7 | 3 | 9 | 2 |
Standard Deviation Formulas | |||
---|---|---|---|
Distribution | Direct Method | Assumed Mean or Short-cut Method | Step Deviation Method |
Individual Series | – | ||
Discrete Series | – | ||
Frequency Distribution | – | – |
示例:使用直接和假定均值方法查找以下数据的标准偏差。
Marks | 25 | 34 | 21 | 28 | 60 | 33 | 72 | 55 |
解:
使用直接方法
首先,我们将计算平均值。
现在,我们将计算方差(σ2)。
方差的公式为:
Marks (x) | d=(xi–x) | d2=(xi–x)2 |
---|---|---|
25 | -16 | 256 |
34 | -7 | 49 |
21 | -20 | 400 |
28 | -13 | 169 |
60 | 19 | 361 |
33 | -8 | 64 |
72 | 31 | 961 |
55 | 15 | 225 |
∑(xi–x)=1 | ∑(xi–x)2= 2485 |
将值放在方差公式中,我们得到:
对于标准偏差的公式为:σ=√σ2
σ= √310.625 = 17.624
σ= 17.624
使用假设均值或捷径法
我们知道各个序列的假设均值方法的公式:
在上式中, d = xA 。假设A为均值。因此,假设A = 38 。
Marks (x) | d=(xi-A) | d2=(xi-A)2 |
---|---|---|
25 | -13 | 169 |
34 | -4 | 16 |
21 | -17 | 289 |
28 | -10 | 100 |
60 | 22 | 484 |
33 | -6 | 36 |
72 | 34 | 1156 |
55 | 17 | 289 |
∑(xi-A)=23 | ∑(xi-A)2= 2539 |
将值放在上面的公式中,我们得到:
示例:使用直接和快捷方法找到下面给出的数据的标准偏差。
Marks (x) | 3.5 | 4.5 | 5.5 | 6.5 | 7.5 | 8.5 | 9.5 |
No. of Students (f) | 3 | 7 | 22 | 60 | 85 | 32 | 8 |
解:
使用直接方法
首先,我们将计算平均值。
我们知道离散序列的直接方法的公式:
Marks (x) | f | d=(xi–x) | d2=(xi–x)2 | fd | fd2 |
---|---|---|---|---|---|
3.5 | 3 | -3 | 9 | -9 | 27 |
4.5 | 7 | -2 | 4 | -14 | 28 |
5.5 | 22 | -1 | 1 | -22 | 22 |
6.5 | 60 | 0 | 0 | 0 | 0 |
7.5 | 85 | 1 | 1 | 85 | 85 |
8.5 | 32 | 2 | 4 | 64 | 128 |
9.5 | 8 | 3 | 9 | 24 | 72 |
∑f=217 | ∑fd2=362 |
将值放在公式中,我们得到:
使用快捷方式
我们知道离散序列的快捷方法的公式:
在上式中, d = xA 。假设A为均值。因此,假设A = 6.5 。
Marks (x) | f | d=(xi-A) | d2=(xi-A)2 | fd | fd2 |
---|---|---|---|---|---|
3.5 | 3 | -3 | 9 | -9 | 27 |
4.5 | 7 | -2 | 4 | -14 | 28 |
5.5 | 22 | -1 | 1 | -22 | 22 |
6.5 | 60 | 0 | 0 | 0 | 0 |
7.5 | 85 | 1 | 1 | 85 | 85 |
8.5 | 32 | 2 | 4 | 64 | 128 |
9.5 | 8 | 3 | 9 | 24 | 72 |
∑f=217 | ∑fd=128 | ∑fd2=362 |
将值放在公式中,我们得到:
因此,标准偏差为1.148。
示例:使用直接和快捷方法计算下面给出的数据的标准偏差。
Marks (x) | 0-10 | 10-20 | 20-30 | 30-40 | 40-50 | 50-60 | 60-70 | 70-80 |
No. of Students (f) | 15 | 15 | 23 | 22 | 25 | 10 | 5 | 10 |
解:
使用步进偏差法
我们知道连续序列的阶跃偏差法的公式:
在上式中 。假设A为均值。因此,首先,我们将计算平均值(m)。在下表中,我们计算了每个班级间隔的平均值。其中,我们假设均值为35 。
Marks (x) | f | d2 | fd | fd2 | ||
---|---|---|---|---|---|---|
0-10 | 15 | 5 | -3 | 9 | -45 | 135 |
10-20 | 15 | 15 | -2 | 4 | -30 | 60 |
20-30 | 23 | 25 | -1 | 1 | -23 | 23 |
30-40 | 22 | 35 (A) | 0 | 0 | 0 | 0 |
40-50 | 25 | 45 | 1 | 1 | 25 | 25 |
50-60 | 10 | 55 | 2 | 4 | 20 | 40 |
60-70 | 5 | 65 | 3 | 9 | 15 | 45 |
70-80 | 10 | 75 | 4 | 16 | 40 | 160 |
∑f=N=125 | ∑fd=2 | ∑fd2=488 |
将值放在公式中,我们得到:
示例:使用总体标准偏差查找标准偏差。
12,2,45,23,55,8,11,19,57,3
解:
在上述问题中,给出了十个学生的分数。问题是说适用样品标准偏差。在这种情况下,我们不会计算所有学生的分数。我们将以一些学生的分数作为计算样本。
我们仅采用了六个分数进行计算,如下所示:
12,45,23,11,19,3
我们知道样本标准偏差的公式:
现在,我们将找到公式中使用的值。
步骤1:计算样本平均值( x ) 。
步骤2:对于每个数据元素,减去均值并平方结果。
x | (xi–x) | (xi–x)2 |
---|---|---|
12 | -7 | 49 |
45 | 26 | 676 |
23 | 4 | 16 |
11 | -7 | 49 |
19 | 0 | 0 |
3 | -16 | 256 |
∑(xi–x)2=1046 |
步骤3:将∑(x i – x ) 2除以N-1 。这里总共有6个元素,因此将总和除以6-1 = 5,我们得到:
步骤4:取上述结果的平方根。
s = √209.2 = 14.46
因此,样本标准偏差为14.46。
示例:使用总体标准偏差查找标准偏差。
12,2,45,23,55,8,11,19,57,3
解:
在上述问题中,给出了十个学生的分数。问题说适用人口标准差。在这种情况下,我们将计算所有学生的分数。
我们知道样本标准偏差的公式:
现在,我们将找到公式中使用的值。
步骤1:计算总体平均值(μ)。
步骤2:对于每个数据元素,减去均值并平方结果。
x | (xi-μ) | (xi-μ)2 |
---|---|---|
12 | -12 | 144 |
2 | -22 | 484 |
45 | 21 | 441 |
23 | -1 | 1 |
55 | 31 | 961 |
8 | -16 | 256 |
11 | -13 | 169 |
19 | -5 | 25 |
57 | 33 | 1089 |
3 | -21 | 441 |
∑(xi-μ)2=4011 |
步骤3:将∑(x i- μ) 2除以N。在这里,总共有10个元素,因此将总和除以10,我们得到:
步骤4:取上述结果的平方根。
σ=√401 = 20.02 = 20
因此,总体标准偏差为20。