学生的t分布或t分布是一种概率分布,当样本量较小且总体方差未知时,用于计算总体参数。关于t分布的理论工作是由WS Gosset完成的;他以笔名“ Student ”发表了他的发现。这就是为什么它被称为Student’s t-test的原因。
它是t统计量的抽样分布。 t统计量的值由下式给出:
t = [ x̄ - μ ] / [ s / sqrt( n ) ]
where,
t = t score
x̄ = sample mean,
μ = population mean,
s = standard deviation of the sample,
n = sample size
何时使用t分布?
在以下情况下使用学生的t分布
- 样本大小必须为30或小于30。
- 总体标准偏差(σ)未知。
- 人口分布必须是单峰且偏斜的。
t分布的数学推导:
t分布是在正态分布总体假设下通过数学推导得出的,公式或方程式将如下所示
f(t) = c(1+(t2/ν))(-ν+1) / 2
where,
c = Constant required to make the area under the curve equal to unity
ν = Degrees of freedom
因此,以上等式表明了针对ν个自由度的t分布的概率密度函数(pdf)。
t分布的属性:
上图表明,蓝色曲线是标准正态分布曲线或Z分布曲线,因为样本大小(n)大于30。红色曲线是t分布曲线,因为样本大小(n)接近30。同样,绿色曲线也是t分布曲线,因为样本大小(n)小于30。
t分布具有以下属性:
- t分布中的变量的范围是-∞到+∞( -∞
)。 - 如果t的幂在概率密度函数(pdf)中是偶数,则t-分布将像正态分布一样对称。
- 对于较大的ν(即增加的样本量n); t分布趋于标准正态分布。这意味着对于不同的ν值,t分布的形状也不同。
- t分布在中心的峰比正常分布的峰少,而在尾部的峰的峰高。从上图可以看出,红色和绿色曲线的中心峰比蓝色曲线少,而尾部的峰更高。
- y(峰高)的值在μ= 0时达到最高,因为在上图中可以看到相同的值。
- 当ν> 1时,分布的平均值等于0,其中ν=自由度,否则未定义。
- 分布的中位数和众数等于0。
- 对于ν> 2,方差等于ν/ν-2 ;对于2 <ν≤4,方差等于∞,否则未定义。
- 如果ν> 3,则偏度等于0,否则不确定。
笔记 –
自由度是指一组数据中独立观察的数量。在估计单个样本的平均得分或比例时,独立观察的数量等于样本数量减去一个。
因此,大小为10的样本的t统计量的分布将通过自由度为10 – 1或9的分布来描述。类似地,具有15个自由度的t分布将与大小为16的样本一起使用。
t分布表:
t分布表给出了不同显着性水平和不同自由度的t值。计算出的t值将与列表中的t值进行比较。例如,如果某人正在执行学生的t检验,并且对该成绩进行了测试,则他的显着性水平为5%,他获得或计算了t值,并且他采用了自己的表格t值,并且计算出的t值高于表t值,在这种情况下,将表示在5%的显着性水平下,总体平均值与样本平均值之间存在显着差异;如果相反,则在这种情况下,它将表示不存在显着差异总体均值和样本均值之间的显着差异为5%的显着性水平。这是t分布表的链接:http://www.ttable.org/