📌  相关文章
📜  数学 |均值、方差和标准差

📅  最后修改于: 2021-09-23 04:48:33             🧑  作者: Mango

平均值是给定数据集的平均值。让我们考虑下面的例子

2,\ 4,\ 4,\ 4,\ 5,\ 5,\ 7,\ 9

这八个数据点的平均值(平均值)为 5:

\frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Formula : \mu=\frac{\sum_{i=1}^{N} x_{i}}{N}

其中 μ 是均值,x 1 , x 2 , x 3 …., x i是元素。另请注意,均值有时表示为\bar{x}

方差是所有数字和平均值之间差异的平方和。
上面例子的偏差。首先,计算每个数据点与均值的偏差,并对每个数据点的结果求平方:

\begin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0 \\ (4-5)^2 = (-1)^2 = 1 && (5-5)^2 = 0^2 = 0 \\ (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4 \\ (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16. \\ \end{array}

方差 =

\frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8}
= 4。

Formula: \sigma^{2}= \frac { \sum_{i=1}^{N} (x_{i}-\mu)^{2}}{N}

其中 μ 是平均值,N 是元素总数或分布频率。

标准偏差是方差的平方根。它是对数据偏离均值的程度的度量。

标准偏差(对于上述数据)= \sqrt{ 4 } = 2

为什么数学家选择平方然后开平方来求偏差,为什么不简单地取值的差异呢?
原因之一是根据均值的定义,差值之和变为 0。绝对差的总和可能是一种选择,但是对于绝对差,很难证明许多很好的定理。 [来源:麻省理工学院视频讲座 1:19]

\textup{Coefficient of variation } =\frac{ \textup{Standard deviation}}{Mean}*100

  1. 如果输入中的所有条目都相同,则标准偏差值为 0。
  2. 如果我们对输入集中的所有值加上(或减去)一个数字,比如 7,则平均值会增加(或减少)7,但标准偏差不会改变。
  3. 如果我们将输入集中的所有值乘以数字 7,则均值和标准差都乘以 7。但是如果我们将所有输入值与负数相乘,比如 -7,则均值乘以 -7,但是标准差乘以 7。
  4. 标准偏差和方差是一种衡量数字分布情况的指标。虽然方差可以让您大致了解散布,但标准差更为具体,可以为您提供与均值的精确距离。
  5. 均值、中位数和众数是数据集中趋势的度量(分组或未分组)。

以下问题已在去年的 GATE 考试中提出
https://www.geeksforgeeks.org/gate-gate-cs-2012-question-64/

参考:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm