📜  如何计算统计显着性?(1)

📅  最后修改于: 2023-12-03 15:09:15.504000             🧑  作者: Mango

如何计算统计显着性?

前言

统计显著性是指某个观察结果是否有意义。在实际应用中,我们常常需要评估某个方案是否有效或比另一个方案更好。统计显著性的计算可以帮助我们做出这种评估。常用的计算方法有p值和置信区间等。

p值

p值是指在假设检验中,当原假设为真时,出现现象的概率。p值越小,即出现这种结果的概率越小,则说明结果越显著。通常我们将p值小于0.05的结果认为是显著的。

计算p值

常见的计算p值的方法有z检验和t检验等。

以z检验为例,步骤如下:

  1. 根据样本数据计算出样本均值和标准差;
  2. 计算出标准误(standard error);
  3. 计算出z值(z-score);
  4. 查z表得到对应的p值。

以下是Python代码示例:

import math
import scipy.stats as st

sample_mean = 80
population_mean = 75
sample_std = 10
sample_size = 100

std_err = sample_std / math.sqrt(sample_size)
z = (sample_mean - population_mean) / std_err
p = st.norm.sf(abs(z))
print(p)

其中,sample_mean表示样本均值,population_mean表示总体均值,sample_std表示样本标准差,sample_size表示样本大小。

置信区间

置信区间指的是对总体参数的一个区间估计。常用的置信区间有95%置信区间和99%置信区间等。例如,在95%置信水平下,我们可以认为总体均值约有95%的概率在置信区间内。

计算置信区间

以95%置信区间为例,步骤如下:

  1. 根据样本数据计算出样本均值和标准差;
  2. 计算出标准误(standard error);
  3. 查t表找到自由度为n-1的t值;
  4. 计算置信区间。

以下是Python代码示例:

import math
import scipy.stats as st

sample_mean = 80
sample_std = 10
sample_size = 100
confidence_level = 0.95

std_err = sample_std / math.sqrt(sample_size)
t = st.t.ppf((1 + confidence_level) / 2, sample_size - 1)
lower = sample_mean - t * std_err
upper = sample_mean + t * std_err

print(f"95% confidence interval: ({lower}, {upper})")

其中,confidence_level表示置信水平,这里设置为0.95。

结语

以上介绍了如何计算统计显着性中常用的p值和置信区间。在实际应用中,我们根据具体情况选择使用哪种方法,帮助我们评估方案的效果或者进行数据分析等。