📅  最后修改于: 2023-12-03 15:27:36.857000             🧑  作者: Mango
中心极限定理(Central Limit Theorem)是概率论中的经典定理,它指出在一定条件下,独立随机变量的和的分布趋向于正态分布。中心极限定理被广泛应用于统计学、自然科学、工程技术等领域。在计算机科学中也有着重要应用,比如在机器学习、数据挖掘、图像处理等方面都会用到。
设 $X_1,X_2,...,X_n$ 是独立同分布的随机变量序列,且具有有限的数学期望 $\mu$ 和方差 $\sigma^2$,则当 $n$ 充分大时,随机变量 $\frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}}$ 的分布近似服从标准正态分布 $N(0,1)$。
公式如下:
$$\lim_{n\to\infty} P\left(\frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}} \leq x \right) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{t^2}{2}} dt$$
其中,$P$ 表示概率分布函数,$N(0,1)$ 表示均值为 $0$,标准差为 $1$ 的标准正态分布。
中心极限定理有以下几个性质:
中心极限定理主要应用于以下三个方面:
中心极限定理的实现依靠于随机变量采样。以下是 Python 语言实现中心极限定理的示例代码:
import numpy as np
def central_limit_theorem(n: int, m: int, mu: float, sigma: float) -> np.ndarray:
"""
:param n: 抽样次数
:param m: 抽样数量
:param mu: 总体均值
:param sigma: 总体标准差
:return: shape=(n, m) 的 numpy.ndarray,表示 n 次抽样中,每次抽样样本均值的分布
"""
samples = np.random.normal(mu, sigma, (n, m))
return np.mean(samples, axis=1)
代码中使用了 numpy.random.normal 函数来产生符合正态分布的随机变量,在通过 np.mean 对样本均值进行计算,并返回均值分布。