平均值是给定数据集的平均值。让我们考虑下面的例子
这八个数据点的平均值(平均值)为5:
其中μ是均值,x 1 ,x 2 ,x 3 …。,x i是元素。还请注意,均值有时表示为
方差是所有数字和均值之差的平方和。
以上示例的偏差。首先,从平均值计算每个数据点的偏差,然后对每个结果的平方:
方差= = 4。
其中μ是均值,N是元素总数或分布频率。
标准偏差是方差的平方根。它是数据与平均值差异程度的度量。
标准偏差(针对以上数据)= = 2
为什么数学家选择平方然后求平方根来求偏差,为什么不简单地取值的差呢?
原因之一是,根据均值的定义,差的总和变为0。绝对差之和可能是一个选择,但由于存在绝对差,因此很难证明许多好的定理。 [来源:麻省理工学院视频讲座,1:19]
- 一些有趣的事实:
- 如果输入中的所有条目相同,则标准偏差的值为0。
- 如果我们在输入集中的所有值上加上(或减去)一个数字,例如7,则均值将增加(或减少)7,但标准差不会改变。
- 如果我们将输入集中的所有值都乘以数字7,则均值和标准差都将乘以7。但是,如果我们将所有输入值都乘以负数(例如-7),则均值将被-7乘以,但标准差乘以7。
- 标准差和方差是衡量数字分布程度的一种度量。方差可以让您大致了解扩散,但标准偏差则更为具体,可以使您与均值保持准确的距离。
- 均值,中位数和众数是数据集中趋势(分组或未分组)的量度。
往年的GATE考试曾提出以下问题
http://quiz.geeksforgeeks.org/gate-gate-cs-2012-question-64/
参考:
https://zh.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm