📜  如何找到标准偏差

📅  最后修改于: 2021-01-07 01:51:25             🧑  作者: Mango

如何找到标准偏差

标准偏差是研究变异(离散)的最重要且使用最广泛的度量。它显示了数据的变化。标准偏差的计算有点复杂。错误的风险很高,因此我们需要高度重视和准确的计算。在本节中,我们将学习如何找到标准偏差。

标准偏差定义

标准偏差(SD)是一种量化方法,用于衡量数据集相对于其平均值的分布(分散)。计算为方差的平方根。用较低的希腊字母σ(sigma)表示。如果偏差较大,则色散将较大,而如果偏差较小,则均匀性也较大。

其他一些定义是:

  • 标准偏差是所有值与平均值之间的差异的度量。
  • 标准差是与平均值的平方差总和的平方根除以观察数。
  • 它是方差的平方根。

方差

它定义了一个随机变量与其期望值的差异。它是期望值和单个值之间差异的平方的平均值。它永远不会有负值。它是由σ2表示。方差公式为:

如何找到标准偏差

通过确定每个数据点之间相对于均值的变化,将其计算为方差的平方根。标准偏差越高,每个数据集和平均值之间的方差越大。

标准差公式

有两个公式可以计算标准偏差。这两个公式都可以测量变化。但是它们之间是有区别的。

  • 人口标准差
  • 样本标准偏差

人口标准差

它是一个参数,可以根据总体中的每个人计算出固定值。人口标准差的公式为:

哪里:

σ :人口标准偏差。

x i :数据中的每个元素

μ :数据集中所有元素的平均值。

N :元素数。

样本标准偏差

这是一个统计数据。在此标准偏差下,仅从人口中抽取一些个体进行计算。它具有更大的可变性,因为它取决于样本。因此,样本的标准偏差大于总体标准偏差。

样品标准偏差的公式为:

哪里:

s :样品标准偏差。

x i :数据集中的每个元素。其中i = 1,2,3,….,N.

x :数据集中所有元素的均值。

N :元素数。

现在,我们将看到这些标准偏差之间的差异。考虑样本和总体标准差公式;我们看到两个公式几乎相同。

步骤1:首先,计算平均值。对所有值求和,然后除以元素数。

步骤2:计算平均值的偏差。要达到相同目的,请从每个值中减去平均值。

步骤3:对偏差进行平方。

步骤4:将偏差平方并添加。

步骤5:将偏差平方除以观察次数。此步骤在总体标准偏差和样本标准偏差之间有很大的不同。

  • 使用总体标准差时,将平方差的总和除以N (元素或观测值的数量)。
  • 使用样本标准偏差时,将平方偏差的总和除以N-1 (小于元素或观测值的数量一)。

步骤6:找到在上一步中得到的商的平方根。

总体值和样本标准差取决于N。 N值越大,总体和样本标准偏差越大。

标准偏差的性质

  • 标准偏差的值永远不会为负。
  • 低偏差表明数据点趋向于非常接近均值。
  • 高偏差表示数据点分布在较大的值范围内。
  • 如果我们将常数添加到所有数据集,则不会影响标准偏差。
  • 如果我们将一个常数乘以所有数据集,则会影响标准偏差。
  • 当且仅当所有观测值都相同时,标准偏差才可以为零。

标准偏差的使用

  • 它被广泛用于生物学研究,统计和金融领域。
  • 它用于将正态曲线拟合到频率分布。
  • 用于测量色散。
  • 它还在金融领域中用于计算金融风险。

标准偏差的方法

直接法

我们也可以使用直接方法找到标准偏差。当偏离实际均值时使用。直接方法的公式为:

哪里:

d =(x ix )

σ :标准偏差

x i :数据集中的每个元素。其中i = 1,2,3,….,N.

x :数据集中所有元素的均值。

N :元素数。

假设均值法

在这种方法中,我们不计算实际均值。取而代之的是,我们选择一个随机值来计算偏差。假定值必须在中间值附近。也称为快捷方式。假定均值方法的公式为:

哪里,

f :对应频率

d = xA (假设A为平均值)

N :数据集中的元素数。

步进偏差法

它是快捷方法的扩展形式。它简化了计算。假定均值方法的公式为:

哪里,

f :对应频率

d = 如何找到标准偏差 (假设A为均值)

N :数据集中的元素数。

i :普通班间隔

发行类型

在转向示例之前,我们必须了解三种分布类型。

  • 个体系列:个体系列是单列观察。例如:
Marks (x) 55 34 78 58 90 67 81
  • 离散系列:在离散系列中,有两列。第一列由观测值组成,第二列由频率组成。例如:
Marks (x) 65 86 58 45 88 90 35
No. of Students (f) 5 7 12 8 4 2 1
  • 频率分布:频率分布也有两列。第一列由观测值组成,第二列由频率组成。观察结果进一步分为称为类的间隔。例如:
Marks (x) 20-30 30-40 40-50 50-60 60-70 70-80 80-90
No. of Students (f) 6 8 14 7 3 9 2
Standard Deviation Formulas
Distribution Direct Method Assumed Mean or Short-cut Method Step Deviation Method
Individual Series How to Find Standard Deviation How to Find Standard Deviation
Discrete Series How to Find Standard Deviation How to Find Standard Deviation
Frequency Distribution How to Find Standard Deviation

个别系列的例子

示例:使用直接和假定均值方法查找以下数据的标准偏差。

Marks 25 34 21 28 60 33 72 55

解:

使用直接方法

首先,我们将计算平均值。

现在,我们将计算方差(σ2)。

方差的公式为: ”如何找到标准偏差”

Marks (x) d=(xix) d2=(xix)2
25 -16 256
34 -7 49
21 -20 400
28 -13 169
60 19 361
33 -8 64
72 31 961
55 15 225
∑(xix)=1 ∑(xix)2= 2485

将值放在方差公式中,我们得到:

对于标准偏差的公式为:σ=√σ2

σ= √310.625 = 17.624
σ= 17.624

使用假设均值或捷径法

我们知道各个序列的假设均值方法的公式:

在上式中, d = xA 。假设A为均值。因此,假设A = 38

Marks (x) d=(xi-A) d2=(xi-A)2
25 -13 169
34 -4 16
21 -17 289
28 -10 100
60 22 484
33 -6 36
72 34 1156
55 17 289
∑(xi-A)=23 ∑(xi-A)2= 2539

将值放在上面的公式中,我们得到:

离散系列的例子

示例:使用直接和快捷方法找到下面给出的数据的标准偏差。

Marks (x) 3.5 4.5 5.5 6.5 7.5 8.5 9.5
No. of Students (f) 3 7 22 60 85 32 8

解:

使用直接方法

首先,我们将计算平均值。

我们知道离散序列的直接方法的公式:

Marks (x) f d=(xix) d2=(xix)2 fd fd2
3.5 3 -3 9 -9 27
4.5 7 -2 4 -14 28
5.5 22 -1 1 -22 22
6.5 60 0 0 0 0
7.5 85 1 1 85 85
8.5 32 2 4 64 128
9.5 8 3 9 24 72
∑f=217 ∑fd2=362

将值放在公式中,我们得到:

使用快捷方式

我们知道离散序列的快捷方法的公式:

在上式中, d = xA 。假设A为均值。因此,假设A = 6.5

Marks (x) f d=(xi-A) d2=(xi-A)2 fd fd2
3.5 3 -3 9 -9 27
4.5 7 -2 4 -14 28
5.5 22 -1 1 -22 22
6.5 60 0 0 0 0
7.5 85 1 1 85 85
8.5 32 2 4 64 128
9.5 8 3 9 24 72
∑f=217 ∑fd=128 ∑fd2=362

将值放在公式中,我们得到:

因此,标准偏差为1.148。

频率分布示例(分组数据或连续序列)

示例:使用直接和快捷方法计算下面给出的数据的标准偏差。

Marks (x) 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80
No. of Students (f) 15 15 23 22 25 10 5 10

解:

使用步进偏差法

我们知道连续序列的阶跃偏差法的公式:

在上式中如何找到标准偏差 。假设A为均值。因此,首先,我们将计算平均值(m)。在下表中,我们计算了每个班级间隔的平均值。其中,我们假设均值为35

Marks (x) f How to Find Standard Deviation How to Find Standard Deviation d2 fd fd2
0-10 15 5 -3 9 -45 135
10-20 15 15 -2 4 -30 60
20-30 23 25 -1 1 -23 23
30-40 22 35 (A) 0 0 0 0
40-50 25 45 1 1 25 25
50-60 10 55 2 4 20 40
60-70 5 65 3 9 15 45
70-80 10 75 4 16 40 160
∑f=N=125 ∑fd=2 ∑fd2=488

将值放在公式中,我们得到:

人口标准偏差示例

示例:使用总体标准偏差查找标准偏差。

12,2,45,23,55,8,11,19,57,3

解:

在上述问题中,给出了十个学生的分数。问题是说适用样品标准偏差。在这种情况下,我们不会计算所有学生的分数。我们将以一些学生的分数作为计算样本。

我们仅采用了六个分数进行计算,如下所示:

12,45,23,11,19,3

我们知道样本标准偏差的公式:

现在,我们将找到公式中使用的值。

步骤1:计算样本平均值( x )

步骤2:对于每个数据元素,减去均值并平方结果。

x (xix) (xix)2
12 -7 49
45 26 676
23 4 16
11 -7 49
19 0 0
3 -16 256
∑(xix)2=1046

步骤3:∑(x ix ) 2除以N-1 。这里总共有6个元素,因此将总和除以6-1 = 5,我们得到:

步骤4:取上述结果的平方根。

s = √209.2 = 14.46

因此,样本标准偏差为14.46。

样本标准偏差示例

示例:使用总体标准偏差查找标准偏差。

12,2,45,23,55,8,11,19,57,3

解:

在上述问题中,给出了十个学生的分数。问题说适用人口标准差。在这种情况下,我们将计算所有学生的分数。

我们知道样本标准偏差的公式:

现在,我们将找到公式中使用的值。

步骤1:计算总体平均值(μ)。

步骤2:对于每个数据元素,减去均值并平方结果。

x (xi-μ) (xi-μ)2
12 -12 144
2 -22 484
45 21 441
23 -1 1
55 31 961
8 -16 256
11 -13 169
19 -5 25
57 33 1089
3 -21 441
∑(xi-μ)2=4011

步骤3:∑(x i- μ) 2除以N。在这里,总共有10个元素,因此将总和除以10,我们得到:

步骤4:取上述结果的平方根。

σ=√401 = 20.02 = 20

因此,总体标准偏差为20。