如何在Python中进行单样本 T 检验
在本文中,我们将了解如何在Python中进行一个示例 T-Test。
Python中的一个示例 T 检验
单样本 t 检验是一种统计假设检验,可用于查看未知总体的平均值是否与给定或已知值不同。在本文中,让我们学习如何执行单样本 t 检验。
null hypothesis: the mean of the areas is 5000.
alternative hypothesis: the mean of the areas is not 5000.
使用的 CSV:
创建用于演示的数据框
Python3
# import packages
import scipy.stats as stats
import pandas as pd
# loading the csv file
data = pd.read_csv('areas.csv')
data.head()
Python3
# import packages
import scipy.stats as stats
import pandas as pd
# loading the csv file
data = pd.read_csv('areas.csv')
# perform one sample t-test
t_statistic, p_value = stats.ttest_1samp(a=data, popmean=5000)
print(t_statistic , p_value)
输出:
在Python中进行一个样本 T 测试
为了执行单样本 t 检验,我们将使用 scipy.stats.ttest_1samp()函数来执行单样本 t 检验。 T 检验是针对一组值的平均值计算的。原假设是独立观察样本的预期均值等于指定的总体均值 popmean。
Syntax: scipy.stats.ttest_1samp(a, popmean, axis=0).
parameters:
- a : an array or iterable object of sample observations.
- popmean : expected mean in the null hypothesis.
- axis : its an optional parameter. represents axis.
returns : t statistic and two tailed p value.
Python3
# import packages
import scipy.stats as stats
import pandas as pd
# loading the csv file
data = pd.read_csv('areas.csv')
# perform one sample t-test
t_statistic, p_value = stats.ttest_1samp(a=data, popmean=5000)
print(t_statistic , p_value)
输出:
[-0.79248301] [0.44346471]
这里
t_statistic is -0.79248301
p-value is 0.44346471
由于给定问题的 p_value 大于 0.05(即 alpha 值),因此我们接受原假设并拒绝替代假设。