平均值是给定数据集的平均值。让我们考虑下面的例子
![由 QuickLaTeX.com 渲染 2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_0.jpg)
这八个数据点的平均值(平均值)为 5:
![由 QuickLaTeX.com 渲染 \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_1.jpg)
![由 QuickLaTeX.com 渲染 Formula : \mu=\frac{\sum_{i=1}^{N} x_{i}}{N}](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_2.jpg)
其中 μ 是平均值,x 1 , x 2 , x 3 …., x i是元素。另外请注意,平均值有时表示为
方差是所有数字和平均值之间差异的平方和。
上面例子的偏差。首先,计算每个数据点与均值的偏差,并对每个数据点的结果求平方:
![由 QuickLaTeX.com 渲染 \begin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0 \\ (4-5)^2 = (-1)^2 = 1 && (5-5)^2 = 0^2 = 0 \\ (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4 \\ (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16. \\ \end{array}](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_4.jpg)
方差 =
![由 QuickLaTeX.com 渲染 \frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8}](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_5.jpg)
![由 QuickLaTeX.com 渲染 Formula: \sigma^{2}= \frac { \sum_{i=1}^{N} (x_{i}-\mu)^{2}}{N}](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_6.jpg)
其中 μ 是平均值,N 是元素总数或分布频率。
标准偏差是方差的平方根。它是对数据偏离均值的程度的度量。
标准偏差(对于上述数据)= = 2
为什么数学家选择平方然后平方根来求偏差,为什么不简单地取值的差异呢?
原因之一是根据均值的定义,差值之和变为 0。绝对差的总和可能是一种选择,但是对于绝对差,很难证明许多很好的定理。 [来源:麻省理工学院视频讲座 1:19]
![由 QuickLaTeX.com 渲染 \textup{Coefficient of variation } =\frac{ \textup{Standard deviation}}{Mean}*100](https://mangodoc.oss-cn-beijing.aliyuncs.com/geek8geeks/Mathematics_%7C_Mean,_Variance_and_Standard_Deviation_8.jpg)
- 如果输入中的所有条目都相同,则标准偏差值为 0。
- 如果我们对输入集中的所有值加上(或减去)一个数字,比如 7,则平均值会增加(或减少)7,但标准偏差不会改变。
- 如果我们将输入集中的所有值乘以数字 7,则均值和标准差都乘以 7。标准差乘以 7。
- 标准偏差和方差是一种衡量数字分布情况的指标。虽然方差可以让您大致了解散布,但标准差更为具体,可以为您提供与均值的精确距离。
- 均值、中位数和众数是数据集中趋势的度量(分组或未分组)。
以下问题已在去年的 GATE 考试中提出
https://www.geeksforgeeks.org/gate-gate-cs-2012-question-64/
参考:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm