📜  什么是统计中的 z 分数 (1)

📅  最后修改于: 2023-12-03 15:36:11.336000             🧑  作者: Mango

什么是统计中的 z 分数

在统计学中,z分数(或标准正态分数)是常用的一种分数,用于表示一个实际数值与对应总体平均值相差的标准偏差个数。z分数是求得标准正态分布曲线上某一点的位置,我们可以利用z分数来计算某一个具体数值所处于总体的位置,知道了z分数,就可以计算出该数值的累积概率和置信区间。

z分数的计算方法是将原始数据减去总体平均值,再除以总体标准偏差。若总体服从正态分布,则z分数的分布也是正态分布,均值为0、标准差为1。

公式

z 分数的计算公式为:

$$ z = \frac{x - \mu}{\sigma} $$

其中:

  • x是原始数据;
  • μ是总体平均值;
  • σ是总体标准差。
用处

z 分数常用于以下情况:

  • 确定一个数据距离总体均值的偏离程度;
  • 确定某个数据所处的位置,并可以用它来计算概率;
  • 用于比较两个不同集合的数值,由于数据已经被标准化,就可以消除量纲问题。
代码片段
import numpy as np

# 计算 z 分数
def calculate_z_score(x, mu, sigma):
    return (x - mu) / sigma

# 例子:计算数据 70 所处的位置
data = [60, 65, 70, 75, 80]
mu = np.mean(data)
sigma = np.std(data)
x = 70
z_score = calculate_z_score(x, mu, sigma)
print(f"数据 {x} 的 z 分数为:{z_score:.2f}")

输出结果为:

数据 70 的 z 分数为:0.00

这意味着数据70即为总体平均值。