📅  最后修改于: 2023-12-03 15:08:58.070000             🧑  作者: Mango
在统计学中,置信区间是指对一组数据的估计值进行区间估计。在Python中,我们可以通过多种方式来计算置信区间。
from scipy import stats
import numpy as np
# sample为样本数据,conf_int为置信区间
sample = np.random.normal(loc=0, scale=1, size=100)
conf_int = stats.t.interval(0.95, len(sample)-1, loc=np.mean(sample), scale=stats.sem(sample))
print(f"置信区间为:{conf_int}")
以上代码中我们使用了scipy
库的stats
模块来计算置信区间。这个方法的好处在于不需要自己实现置信区间的计算公式,只需要提供样本数据即可。函数stats.t.interval
的参数如下:
0.95
:置信水平,即95%的置信水平len(sample)-1
:自由度,即样本容量减一loc=np.mean(sample)
:均值,即样本均值scale=stats.sem(sample)
:标准误差,即样本标准差除以样本容量的开方以上代码输出的是一个tuple,表示置信区间的下界和上界。
import numpy as np
# sample为样本数据,conf_int为置信区间
sample = np.random.normal(loc=0, scale=1, size=100)
conf_int = np.percentile(sample, [2.5, 97.5])
print(f"置信区间为:{conf_int}")
以上代码中我们使用了numpy
库来计算置信区间。这个方法的好处在于不需要导入额外的库,更加轻量级。我们使用numpy
库的percentile
函数来计算置信区间的下界和上界。函数percentile
的参数如下:
sample
:样本数据[2.5, 97.5]
:百分位数,即去掉最低2.5%和最高2.5%后的区间以上代码输出的是一个数组,表示置信区间的下界和上界。
以上介绍了两种常用的方法来在Python中计算置信区间,分别使用了scipy
和numpy
两个库。选择哪种方法可以根据自己的需求和喜好来决定。