贝塞尔校正

贝塞尔校正是指在样本方差或样本分布的公式中用作分母的n-1部分。

$s^2=\frac{\sum\limits_{i=1}^{n}(x_{i}-\bar{x})^2}{n-1}$
$\hspace{5mm}Here\hspace{1mm}s^2\hspace{1mm}is\hspace{1mm} the\hspace{1mm} sample\hspace{1mm}variance, \bar{x}\hspace{1mm} is \hspace{1mm}the\hspace{1mm} sample\hspace{1mm}mean \hspace{1mm}and \hspace{1mm} n\hspace{1mm} is\hspace{1mm} the\hspace{1mm} number\hspace{1mm} of \hspace{1mm}observations \hspace{1mm}in \hspace{1mm}the \hspace{1mm}sample.$

为什么是 n-1？
假设从具有均值(u) 和方差(sigma ² ) 的总体中抽取n 个独立观测值。一般来说，(u) 和 (sigma) 都是未知的，需要估计。

样本均值估计总体均值(u)，样本方差 s ²估计总体方差 (sigma ² )。理想情况下 (sigma ² ) 应该估计为

$\frac{\sum\limits_{i=1}^{n}(x_{i}-u)^2}{n} ----Eqn(1)$

由于 u 未知，因此样本均值被证明是可以使用的最佳估计量。因此

$\frac{\sum\limits_{i=1}^{n}(x_{i}-\bar{x})^2}{n} ----Eqn(2)$

问题：
在 Eqn(2) 中减去样本均值使这个总和尽可能小，粗略地说，样本均值必须落在观测值的中心附近，而总体均值可以是任何值。因此Eqn(2)中的总和将小于Eqn(1) 中的总和，因此 E qn(2)倾向于低估总体方差的真实值。

解决方案：
为了弥补这一点，除以 n-1 会使样本方差比除以 n 时的样本方差大一点。事实证明，它在数学上正确地补偿了这个问题。

$s^2=\frac{\sum\limits_{i=1}^{n}(x_{i}-\bar{x})^2}{n-1}$

平均而言，这个估计量等于总体方差（sigma ² ），这里不明显为什么这里（n-1）有效，为什么这个估计量平均等于总体方差（sigma ² ）？为什么 (n-2) 或 (n-3) 或 (n-0.5) 不用于除法？

When the sample standard deviation is calculated from a sample of n values, sample mean is used which has already been calculated from that same sample of n values. The calculated sample mean has already “used up” one of the “degrees of freedom of variability”(which is the mean itself) that is available in the sample. Only n-1 degrees of freedom of variability are left for the calculation of the sample standard deviation.

编程需要懂一点英语

例子：
假设从总体均值（u）未知的总体中抽取 3 个独立观测值，我们发现样本均值 = 5，我们用它来估计总体均值（u）。鉴于此信息，前两个观察值可以是任何值，假设它们是 7 和 5。

i	x_i	x_i-(sample_mean)
1.	7	7-5=2
2.	5	5-5=0
3.	3	3-5=-2

如果观察的平均值是 5 并且我们知道前两个观察是 7 & 5 那么第三个必须是 3 并且我们知道这第三个偏差必须是 -2，因为与样本平均值的所有偏差总和为零。

所以第三个观察不再是任何值，所以一旦样本均值和这三个值中的任意两个已知，这里只剩下两个自由度我们知道第三个值必须是什么，我们从三个自由度开始当我们从总体中获得三个独立观测值时的自由度，但是当我们用样本均值估计总体均值（u）时，我们失去了一个自由度。因此，为了在这里计算样本方差（s ² ），我们取平方偏差的总和并将其除以自由度（3-1）。

$s^2=\frac{(7-5)^2+(5-5)^2+(3-5)^2}{3-1}$

So, when estimating the population variance, it is typically divided by the degrees of freedom as opposed to the sample-size as this results in a better estimator.

编程需要懂一点英语