📅  最后修改于: 2023-12-03 15:09:15.504000             🧑  作者: Mango
统计显著性是指某个观察结果是否有意义。在实际应用中,我们常常需要评估某个方案是否有效或比另一个方案更好。统计显著性的计算可以帮助我们做出这种评估。常用的计算方法有p值和置信区间等。
p值是指在假设检验中,当原假设为真时,出现现象的概率。p值越小,即出现这种结果的概率越小,则说明结果越显著。通常我们将p值小于0.05的结果认为是显著的。
常见的计算p值的方法有z检验和t检验等。
以z检验为例,步骤如下:
以下是Python代码示例:
import math
import scipy.stats as st
sample_mean = 80
population_mean = 75
sample_std = 10
sample_size = 100
std_err = sample_std / math.sqrt(sample_size)
z = (sample_mean - population_mean) / std_err
p = st.norm.sf(abs(z))
print(p)
其中,sample_mean
表示样本均值,population_mean
表示总体均值,sample_std
表示样本标准差,sample_size
表示样本大小。
置信区间指的是对总体参数的一个区间估计。常用的置信区间有95%置信区间和99%置信区间等。例如,在95%置信水平下,我们可以认为总体均值约有95%的概率在置信区间内。
以95%置信区间为例,步骤如下:
以下是Python代码示例:
import math
import scipy.stats as st
sample_mean = 80
sample_std = 10
sample_size = 100
confidence_level = 0.95
std_err = sample_std / math.sqrt(sample_size)
t = st.t.ppf((1 + confidence_level) / 2, sample_size - 1)
lower = sample_mean - t * std_err
upper = sample_mean + t * std_err
print(f"95% confidence interval: ({lower}, {upper})")
其中,confidence_level
表示置信水平,这里设置为0.95。
以上介绍了如何计算统计显着性中常用的p值和置信区间。在实际应用中,我们根据具体情况选择使用哪种方法,帮助我们评估方案的效果或者进行数据分析等。