📜  配对的T检验-详细概述(1)

📅  最后修改于: 2023-12-03 14:58:09.896000             🧑  作者: Mango

配对的T检验-详细概述

简介

配对的T检验(paired t-test)是一种常见的统计方法,用于比较两个相关样本的均值是否有显著差异。该方法的前提是两组数据之间有一定的相关性,即同一组样本在不同时刻或不同条件下的测量值。

原理

配对样本t检验的原理是比较样本均值差异是否显著。假设有两个相关样本:样本 $X=(x_1, x_2, ..., x_n)$ 和样本 $Y=(y_1, y_2, ..., y_n)$,我们要比较它们的均值是否有显著差异。

  1. 计算差值$d_i$:$d_i = x_i - y_i$。
  2. 计算差值平均值$\bar d$:$\bar d = \dfrac{\sum_{i=1}^n d_i}{n}$。
  3. 计算 $d$ 的标准差$s_d$:$s_d = \sqrt{\dfrac{\sum_{i=1}^n (d_i - \bar d)^2}{n-1}}$。
  4. 计算 t 统计量:$t = \dfrac{\bar d}{s_d / \sqrt{n}}$。
  5. 根据显著性水平和自由度,查表或计算得到检验统计量的临界值,进行假设检验。
假设检验

一般地,假设 $H_0:\mu_d=0$,即差值的均值为0,$H_1:\mu_d\neq0$,即差值的均值不为0。

在配对样本t检验中,检验统计量$t$的分布是t分布,自由度为$n-1$。对于正态分布的配对样本,可以使用这个检验来验证均值差异是否显著。

我们可以将检验结果表示为“在给定的显著性水平$\alpha$下,接受/拒绝原假设$H_0$,表示相应差异是否显著”。

适用条件
  1. 样本数据应为配对样本;
  2. 差值应服从正态分布或样本容量足够大(n>30),满足中心极限定理的要求;
  3. 差值方差在总体差值方差中有显著差异;
  4. 差值应为连续变量。
实现方法

我们下面给出一个python的实现,用来计算配对样本t检验的 $t$ 值,同时可根据显著性水平和自由度,查表或计算得到检验统计量的临界值,进行假设检验。

import numpy as np
from scipy.stats import t

def paired_t_test(x, y, alpha, tails):
    n = len(x)
    diff = x - y
    mean_diff = np.mean(diff)
    se = np.std(diff, ddof=1) / np.sqrt(n)
    t_val = mean_diff / se
    df = n - 1
    if tails == "two":
        p_val = 2 * (1 - t.cdf(abs(t_val), df))
    else:
        p_val = 1 - t.cdf(abs(t_val), df)
    if p_val < alpha:
        return f"Reject null hypothesis with t = {t_val} and p-value = {p_val}"
    else:
        return f"Fail to reject null hypothesis with t = {t_val} and p-value = {p_val}"

其中,$x$ 和 $y$ 分别是长度为 $n$ 的配对样本,$alpha$ 是显著性水平,$tails$ 是单侧或双侧检验。函数通过计算差值$d_i$,计算差值平均值$\bar d$,计算差值的标准差$s_d$,计算 t 统计量,然后查表或计算得到检验统计量的临界值,进行假设检验。

总结

配对样本t检验是一种常见的统计方法,适用于比较两个相关样本的均值是否有显著差异。该方法的前提是两组数据之间有一定的相关性。我们可以根据显著性水平和自由度,查表或计算得到检验统计量的临界值,进行假设检验,来验证均值差异是否显著。