📅  最后修改于: 2023-12-03 15:08:58.054000             🧑  作者: Mango
卡方检验是用来比较实际观测值和理论预期值的差异情况的一种假设检验方法,它是一种广泛应用于定性资料分析的统计方法。
Python中实现卡方检验可以使用scipy库中的chi2_contingency函数。
from scipy.stats import chi2_contingency
# 创建一个观测矩阵
obs = [[10, 20, 30], [6, 9, 17]]
# 计算卡方值、p值、自由度数和理论预期值
chi2, p, dof, expected = chi2_contingency(obs)
print('卡方值={:.4f}'.format(chi2))
print('p值={:.4f}'.format(p))
print('自由度数={:.4f}'.format(dof))
print('理论预期值=\n', expected)
以上代码将计算一个 $2 \times 3$ 的观测矩阵的卡方值、p值、自由度数和理论预期值。
卡方值表示实际观测值和理论预期值的差异情况,如果卡方值越小,则表示实际观测值和理论预期值越接近。
p值表示卡方检验的显著性水平,如果p值越小,则表示实际观测值和理论预期值的差异越显著。
自由度数是指卡方检验中受限制的变量个数。
理论预期值是指根据样本数量和总体分布情况计算得出的期望值。
卡方检验可以用于以下场景:
卡方检验是进行分类变量之间关系检验的一种有效方法,Python中可以使用scipy库中的chi2_contingency函数进行卡方检验的计算。