如何在Python中进行配对样本 T 检验
配对样本 T 检验:此检验也称为相关样本 t 检验。它是一个统计概念,用于检查两组观测值之间的平均差是否等于零。在此测试中,每个实体都被测量两次,从而产生成对的观察结果。
在我们的系统中安装 Scipy 库的语法:
pip install scipy
如何在Python中进行配对样本 T 检验?
让我们考虑一下,我们想知道一种发动机油是否会显着影响不同品牌的汽车行驶里程。为了对此进行测试,我们最初在车库中放置了 10 辆汽车,并添加了原装发动机油。我们已经记录了他们每人 100 公里的里程数。然后,我们为每辆汽车添加了另一种发动机油(与原来的不同)。然后,以每辆 100 公里计算汽车的行驶里程。为了比较第一次和第二次测试的平均里程之间的差异,我们使用配对样本 t 检验,因为对于每辆车,他们的第一次测试成绩可以与他们的第二次测试成绩配对。进行配对样本 T 检验是一个循序渐进的过程。
第 1 步:构建数据。
我们需要两个数组来保存汽车的前里程和后里程。
Python3
# pre holds the mileage before applying
# the different engine oil
pre = [88, 82, 84, 93, 75, 78, 84, 87,
95, 91, 83, 89, 77, 68, 91]
# post holds the mileage before applying
# the different engine oil
post = [91, 84, 88, 90, 79, 80, 88, 90,
90, 96, 88, 89, 81, 74, 92]
Python3
# Importing library
import scipy.stats as stats
# pre holds the mileage before
# applying the different engine oil
pre = [30, 31, 34, 40, 36, 35,
34, 30, 28, 29]
# post holds the mileage after
# applying the different engine oil
post = [30, 31, 32, 38, 32, 31,
32, 29, 28, 30]
# Performing the paired sample t-test
stats.ttest_rel(pre, post)
第 2 步:进行配对样本 T 检验。
Scipy 库包含 ttest_rel()函数,我们可以使用它在Python中进行配对样本 t 检验。语法如下,
Syntax:
ttest_rel(arr1, arr2)
Parameters:
- arr1: It represents an array of sample observations from group 1
- arr2: It represents an array of sample observations from group 2
例子:
Python3
# Importing library
import scipy.stats as stats
# pre holds the mileage before
# applying the different engine oil
pre = [30, 31, 34, 40, 36, 35,
34, 30, 28, 29]
# post holds the mileage after
# applying the different engine oil
post = [30, 31, 32, 38, 32, 31,
32, 29, 28, 30]
# Performing the paired sample t-test
stats.ttest_rel(pre, post)
输出:
检验统计量等于 2.584,相应的两侧 p 值为 0.029。
第 3 步:分析输出。
配对样本 t 检验遵循零假设和备择假设:
- H0:表示前测和后测的平均分相等
- HA:这意味着平均前测和后测分数不相等
由于 p 值等于 0.029,小于 0.05,因此我们拒绝原假设。因此,我们有足够的证据表明,在使用不同机油之前和之后,汽车的真实平均测试分数是不同的。