📜  统计-经验法则(1)

📅  最后修改于: 2023-12-03 15:41:18.424000             🧑  作者: Mango

统计-经验法则

统计-经验法则指的是一些统计学中的定理,可以用于给出数据的大致分布情况。根据该定理,对于一般数据分布类型,都有一定的规律性可言,可以通过数据样本来进行推算。下面我们将详细介绍统计-经验法则及其应用。

什么是统计-经验法则

统计-经验法则,又称为拉普拉斯-高斯定理,是概率统计学中的定理。它是一个经验性规律,可以用于描述一般数据分布类型,可以对数据样本的分布情况进行推算。具体而言,统计-经验法则表示,对于任意一组正态分布的数据,约有68%的数据落在平均值左右的一个标准差范围内,约有95%的数据落在平均值左右的两个标准差范围内,约有99.7%的数据落在平均值左右的三个标准差范围内。

统计-经验法则的公式

下面是统计-经验法则的公式:

  • 约68%的数据,落在平均值左右的一个标准差范围内。
  • 约95%的数据,落在平均值左右的两个标准差范围内。
  • 约99.7%的数据,落在平均值左右的三个标准差范围内。
统计-经验法则的应用

统计-经验法则可以用于探究数据的分布情况。通过分析符合正态分布的数据,我们可以大致推算出其分布情况,并对数据异常或不一致的地方进行分析和修正。在实际中,统计-经验法则经常被用来探究数据的均值、标准差、方差等,以及其他相关统计指标。

示例
import numpy as np
import matplotlib.pyplot as plt

# 生成符合正态分布的数据
mu, sigma = 0, 0.1
s = np.random.normal(mu, sigma, 1000)

# 统计均值和标准差
mean = np.mean(s)
std = np.std(s)

# 绘制直方图
count, bins, ignored = plt.hist(s, 30, density=True)
plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *
         np.exp(- (bins - mu)**2 / (2 * sigma**2)),
         linewidth=2, color='r')

# 绘制标准差范围
plt.axvline(mean, color='k', linestyle='dashed', linewidth=1)
plt.axvline(mean - std, color='k', linestyle='dashed', linewidth=1)
plt.axvline(mean + std, color='k', linestyle='dashed', linewidth=1)
plt.axvline(mean - 2*std, color='k', linestyle='dashed', linewidth=1)
plt.axvline(mean + 2*std, color='k', linestyle='dashed', linewidth=1)

# 添加标题和标签
plt.title('Normal distribution')
plt.xlabel('Value')
plt.ylabel('Probability density')

plt.show()

上述代码使用了numpy和matplotlib库,首先生成一个符合正态分布的样本,然后统计均值和标准差,并绘制直方图。通过统计-经验法则,我们可以确定标准差范围,并将其绘制在直方图上。可以看出,绝大部分的数据确实落在了标准差范围之内。