📅  最后修改于: 2023-12-03 15:06:15.255000             🧑  作者: Mango
中心极限定理(Central Limit Theorem)是统计学中一个十分重要的定理, 概括地来说,它说明:对于某些特定条件的随机变量序列,在等于序列数目的极限情况下,其均值的分布趋近于一个正态分布。
中心极限定理的数学公式如下:
$$ \lim_{n \to \infty} P\left(\frac{\sum_{i=1}^{n}X_i - n\mu}{\sigma\sqrt{n}}\leq x\right) = \Phi(x) $$
其中:
中心极限定理在实际应用中,广泛用于统计推断,特别是参数估计和假设检验。在进行大样本估计问题时,如果总体分布未知,而样本量又大于 30,我们通常可以用中心极限定理来保证样本均值的分布是近似正态分布。
下面是一个 Python 代码片段,用来模拟掷骰子的数据,并应用中心极限定理:
import random
import matplotlib.pyplot as plt
# 模拟掷骰子,得到投掷点数的均值
def roll_dice(times):
return sum([random.randint(1,6) for _ in range(times)]) / times
# 模拟投掷骰子 10000 次,并计算其均值的分布
def simulate(n):
data = [roll_dice(n) for _ in range(10000)]
return data
# 绘制均值分布的直方图
def draw_hist(n):
data = simulate(n)
plt.hist(data,bins=30,density=True)
# 绘制不同样本量下的均值分布直方图
plt.figure(figsize=(12,4))
plt.subplot(1,3,1)
plt.title('n=10')
draw_hist(10)
plt.subplot(1,3,2)
plt.title('n=50')
draw_hist(50)
plt.subplot(1,3,3)
plt.title('n=100')
draw_hist(100)
plt.show()
以上代码将模拟掷骰子过程,并计算均值的分布,最后绘制不同样本量下均值分布的直方图。可以看到,随着样本量的增加,均值分布逐渐趋近于正态分布。