📜  如何在 R 中找到 Z 临界值(1)

📅  最后修改于: 2023-12-03 15:24:21.065000             🧑  作者: Mango

如何在 R 中找到 Z 临界值

Z 临界值(Z-critical value)是指与标准正态分布相关的统计学领域中的一种概念,用于确定给定置信度下的临界值。了解如何找到 Z 临界值对于进行假设检验或计算置信区间非常重要。

在 R 中,我们可以使用内置的 qnorm() 函数来计算 Z 分数或 Z 临界值。该函数的语法为:

qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)

其中,参数 p 指定了累积分布函数(CDF)的值,即 P(Z ≤ z),其范围在 0 到 1 之间;meansd 分别是标准正态分布的均值和标准差(默认值为 0 和 1);lower.tail 是一个逻辑值,指示是否对较小的累积分布值计算 Z 分数(即 P(Z ≤ z)),默认为 TRUElog.p 也是一个逻辑值,指示传递给函数的 p 值是否是对数形式。

举例

假设我们要计算给定置信度下的 Z 临界值,如 95% 置信度(即 α = 0.05)。要找到这个值,我们可以使用以下代码:

# 找到 95% 置信度下的 Z 临界值
z_critical <- qnorm(p = 0.975)

# 输出结果
z_critical
#> [1] 1.959964

根据标准正态分布的性质,我们知道在给定置信度下,Z 临界值也可以通过计算标准误差(SE)来获得。该值为:

$$Z = \frac{\bar{x} - \mu}{SE}$$

其中,$\bar{x}$ 是样本均值,$\mu$ 是总体均值,$SE = \frac{s}{\sqrt{n}}$ 是标准误差,$s$ 是样本标准差,$n$ 是样本容量。

在 R 中,我们可以使用以下代码计算样本均值和标准差,并使用样本数据计算 Z 分数:

# 创建一个样本数据集
x <- c(10, 15, 18, 12, 16, 20, 14, 9, 22, 19)

# 计算样本均值和标准差
x_bar <- mean(x)
s <- sd(x)
n <- length(x)

# 计算 Z 分数
z_score <- (x_bar - 16) / (s / sqrt(n))

# 输出结果
z_score
#> [1] 1.554958

由于这个例子的 Z 分数为 1.55,远小于 Z 临界值(1.96),我们无法拒绝零假设,即我们不能肯定样本均值与总体均值之间存在显著差异。