📅  最后修改于: 2023-12-03 14:40:11.888000             🧑  作者: Mango
conf_int
是一个Python函数,用于计算数据的置信区间。置信区间是指一个统计样本中的真实总体参数值可能存在的范围。使用 conf_int
函数可以帮助程序员更好的理解数据和了解其是否具有统计学意义。
conf_int
函数接受以下参数:
data
:要计算置信区间的输入数据,可以是一维的数组,Series或DataFrame。alpha
:置信水平,默认为0.95,表示95%的置信水平。alternative
:备择假设,可选值为"two-sided"
、"less"
或"greater"
,默认为"two-sided"
。conf_int
函数返回一个元组,包含置信区间的上限和下限。
下面是一个示例代码:
import pandas as pd
from scipy import stats
def conf_int(data, alpha=0.95, alternative="two-sided"):
"""
计算数据的置信区间
Arguments:
data -- 输入的数据
alpha -- 置信水平,默认0.95
alternative -- 备择假设,默认为"two-sided"
Returns:
置信区间的上限和下限
"""
n = len(data)
mean, se = data.mean(), stats.sem(data)
if alternative == "two-sided":
z = stats.norm.ppf(1 - (1 - alpha) / 2)
ci = z * se
return mean - ci, mean + ci
elif alternative == "less":
t = stats.t.ppf(alpha, n - 1)
ci = t * se
return float("-inf"), mean + ci
elif alternative == "greater":
t = stats.t.ppf(alpha, n - 1)
ci = t * se
return mean - ci, float("inf")
else:
raise ValueError("Unknown alternative hypothesis")
运行以上代码后,可以使用以下代码计算一个数值列表的置信区间:
data = [1, 2, 3, 4, 5]
c_int = conf_int(data, alpha=0.95, alternative="two-sided")
print(c_int)
将返回以下结果:
(1.236672373162903, 4.763327626837096)
以上结果可以表明,这个数据列表的真实总体参数值在 1.24 到 4.76 之间,置信水平为95%。