📅  最后修改于: 2023-12-03 15:24:21.065000             🧑  作者: Mango
Z 临界值(Z-critical value)是指与标准正态分布相关的统计学领域中的一种概念,用于确定给定置信度下的临界值。了解如何找到 Z 临界值对于进行假设检验或计算置信区间非常重要。
在 R 中,我们可以使用内置的 qnorm()
函数来计算 Z 分数或 Z 临界值。该函数的语法为:
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
其中,参数 p
指定了累积分布函数(CDF)的值,即 P(Z ≤ z),其范围在 0 到 1 之间;mean
和 sd
分别是标准正态分布的均值和标准差(默认值为 0 和 1);lower.tail
是一个逻辑值,指示是否对较小的累积分布值计算 Z 分数(即 P(Z ≤ z)),默认为 TRUE
;log.p
也是一个逻辑值,指示传递给函数的 p 值是否是对数形式。
假设我们要计算给定置信度下的 Z 临界值,如 95% 置信度(即 α = 0.05)。要找到这个值,我们可以使用以下代码:
# 找到 95% 置信度下的 Z 临界值
z_critical <- qnorm(p = 0.975)
# 输出结果
z_critical
#> [1] 1.959964
根据标准正态分布的性质,我们知道在给定置信度下,Z 临界值也可以通过计算标准误差(SE)来获得。该值为:
$$Z = \frac{\bar{x} - \mu}{SE}$$
其中,$\bar{x}$ 是样本均值,$\mu$ 是总体均值,$SE = \frac{s}{\sqrt{n}}$ 是标准误差,$s$ 是样本标准差,$n$ 是样本容量。
在 R 中,我们可以使用以下代码计算样本均值和标准差,并使用样本数据计算 Z 分数:
# 创建一个样本数据集
x <- c(10, 15, 18, 12, 16, 20, 14, 9, 22, 19)
# 计算样本均值和标准差
x_bar <- mean(x)
s <- sd(x)
n <- length(x)
# 计算 Z 分数
z_score <- (x_bar - 16) / (s / sqrt(n))
# 输出结果
z_score
#> [1] 1.554958
由于这个例子的 Z 分数为 1.55,远小于 Z 临界值(1.96),我们无法拒绝零假设,即我们不能肯定样本均值与总体均值之间存在显著差异。