平均值是给定数据集的平均值。让我们考虑下面的例子
这八个数据点的平均值(平均值)为 5:
其中 μ 是均值,x 1 , x 2 , x 3 …., x i是元素。另请注意,均值有时表示为
方差是所有数字和平均值之间差异的平方和。
上面例子的偏差。首先,计算每个数据点与均值的偏差,并对每个数据点的结果求平方:
方差 =
其中 μ 是平均值,N 是元素总数或分布频率。
标准偏差是方差的平方根。它是对数据偏离均值的程度的度量。
标准偏差(对于上述数据)= = 2
为什么数学家选择平方然后开平方来求偏差,为什么不简单地取值的差异呢?
原因之一是根据均值的定义,差值之和变为 0。绝对差的总和可能是一种选择,但是对于绝对差,很难证明许多很好的定理。 [来源:麻省理工学院视频讲座 1:19]
- 如果输入中的所有条目都相同,则标准偏差值为 0。
- 如果我们对输入集中的所有值加上(或减去)一个数字,比如 7,则平均值会增加(或减少)7,但标准偏差不会改变。
- 如果我们将输入集中的所有值乘以数字 7,则均值和标准差都乘以 7。但是如果我们将所有输入值与负数相乘,比如 -7,则均值乘以 -7,但是标准差乘以 7。
- 标准偏差和方差是一种衡量数字分布情况的指标。虽然方差可以让您大致了解散布,但标准差更为具体,可以为您提供与均值的精确距离。
- 均值、中位数和众数是数据集中趋势的度量(分组或未分组)。
以下问题已在去年的 GATE 考试中提出
https://www.geeksforgeeks.org/gate-gate-cs-2012-question-64/
参考:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm