📜  统计中学生的 t 分布

📅  最后修改于: 2021-09-22 10:49:22             🧑  作者: Mango

学生 t 分布或 t 分布是一种概率分布,用于在样本量较小且总体方差未知时计算总体参数。 t 分布的理论工作由WS Gosset完成;他以“学生”的笔名发表了他的发现。这就是为什么它被称为Student’s t-test

它是 t 统计量的抽样分布。 t 统计量的值由下式给出:

t = [ x̄ - μ ] / [ s / sqrt( n ) ]

where,
t = t score
x̄ = sample mean,
μ = population mean,
s = standard deviation of the sample,
n = sample size 

何时使用 t 分布?

学生的 t 分布用于

  • 样本大小必须为 30 或小于 30。
  • 总体标准差 (σ) 未知。
  • 人口分布必须是单峰和偏斜的。

t分布的数学推导:

t分布是在人口正态分布的假设下数学推导出来的,公式或方程将是这样的

因此,上面的方程表示 ν 自由度的 t 分布的概率密度函数(pdf)。

t 分布的性质:

上图表明,蓝色曲线是标准正态分布曲线或 Z 分布曲线,因为样本量(n)大于 30。红色曲线是 t 分布曲线,因为样本量(n)接近 30。 同样,绿色曲线也是 t 分布曲线,因为样本大小 (n) 小于 30。

t 分布具有以下特性:

  • t 分布中的变量范围从 -∞ 到 +∞ ( -∞ < t < +∞ )。
  • 如果 t 的幂在概率密度函数(pdf) 中是偶数,则 t 分布将像正态分布一样对称。
  • 对于较大的 ν 值(即增加的样本量 n); t 分布趋于标准正态分布。这意味着对于不同的 ν 值,t 分布的形状也不同。
  • 与正态分布相比,t 分布在中心的峰值较低,而在尾部的峰值较高。从上图中可以看出,与蓝色曲线相比,红色和绿色曲线在中心的峰值较小,但在尾部的峰值较高。
  • y(峰高)的值在 μ = 0 时达到最高,因为在上图中可以观察到相同的情况。
  • 对于 ν > 1,分布的平均值等于 0,其中 ν = 自由度,否则未定义。
  • 分布的中位数和众数等于 0。
  • 对于 ν > 2,方差等于ν / ν-2 ,对于 2 < ν ≤ 4,方差等于 ∞ 否则未定义。
  • 对于 ν > 3,偏度等于 0,否则未定义。

笔记 –
自由度是指一组数据中独立观察的数量。在估计单个样本的平均分数或比例时,独立观察的数量等于样本大小减 1。
因此,大小为 10 的样本的 t 统计量分布将描述为具有 10 – 1 或 9 个自由度的分布。类似地,具有 15 个自由度的 t 分布将用于大小为 16 的样本。

t-分布表:
t 分布表给出了不同显着性水平和不同自由度的 t 值。计算出的 t 值将与列表中的 t 值进行比较。例如,如果一个人正在执行学生的 t 检验并且对于该表现,他已经采用了 5% 的显着性水平,并且他得到或计算了 t 值,并且他已经采用了他的列表 t 值,如果计算出的 t 值高于表中的 t 值,在这种情况下,它会说总体均值和样本均值在 5% 的显着性水平上存在显着差异,如果反之亦然,那么在这种情况下,它会说没有总体均值与样本均值在 5% 的显着性水平上存在显着差异。这是 t-Distribution 表的链接:http://www.ttable.org/