📌  相关文章
📜  数学|均值,方差和标准差

📅  最后修改于: 2021-04-29 11:18:45             🧑  作者: Mango

平均值是给定数据集的平均值。让我们考虑下面的例子

 2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9

这八个数据点的平均值(平均值)为5:

 \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Formula : \mu=\frac{\sum_{i=1}^{N} x_{i}}{N}

其中μ是均值,x 1 ,x 2 ,x 3 …。,x i是元素。还请注意,均值有时表示为\bar{x}

方差是所有数字和均值之差的平方和。
以上示例的偏差。首先,从平均值计算每个数据点的偏差,然后对每个结果的平方:

 \begin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0 \\ (4-5)^2 = (-1)^2 = 1 && (5-5)^2 = 0^2 = 0 \\ (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4 \\ (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16. \\ \end{array}

方差= \frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8} = 4。

Formula:  \sigma^{2}= \frac { \sum_{i=1}^{N} (x_{i}-\mu)^{2}}{N}

其中μ是均值,N是元素总数或分布频率。

标准偏差是方差的平方根。它是数据与平均值差异程度的度量。

标准偏差(针对以上数据)= \sqrt{ 4 } = 2

为什么数学家选择平方然后求平方根来求偏差,为什么不简单地取值的差呢?
原因之一是,根据均值的定义,差的总和变为0。绝对差之和可能是一个选择,但由于存在绝对差,因此很难证明许多好的定理。 [来源:麻省理工学院视频讲座,1:19]

\textup{Coefficient of variation } =\frac{ \textup{Standard deviation}}{Mean}*100

    一些有趣的事实:
  1. 如果输入中的所有条目相同,则标准偏差的值为0。
  2. 如果我们在输入集中的所有值上加上(或减去)一个数字,例如7,则均值将增加(或减少)7,但标准差不会改变。
  3. 如果我们将输入集中的所有值都乘以数字7,则均值和标准差都将乘以7。但是,如果我们将所有输入值都乘以负数(例如-7),则均值将被-7乘以,但标准差乘以7。
  4. 标准差和方差是衡量数字分布程度的一种度量。方差可以让您大致了解扩散,但标准偏差则更为具体,可以使您与均值保持准确的距离。
  5. 均值,中位数和众数是数据集中趋势(分组或未分组)的量度。

往年的GATE考试曾提出以下问题
http://quiz.geeksforgeeks.org/gate-gate-cs-2012-question-64/

参考:
https://zh.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm