📅  最后修改于: 2023-12-03 14:49:43.903000             🧑  作者: Mango
在统计学中,偏差是指样本或数据的平均值与真值(总体平均值)之间的差异。了解数据的偏差有助于我们更好地理解数据的分布情况。
本文主要介绍如何使用 NumPy 计算数据的绝对偏差和绝对平均偏差。
绝对偏差(Absolute Deviation)指每个数据与数据的平均值之差的绝对值。
可以使用 NumPy 中的 abs()
函数计算数据与数据的平均值之差的绝对值,并使用 mean()
函数取得平均值。
import numpy as np
data = np.array([1, 2, 3, 4, 5])
mean = np.mean(data)
abs_dev = np.abs(data - mean)
abs_dev_mean = np.mean(abs_dev)
print(abs_dev) # [2.0 1.0 0.0 1.0 2.0]
print(abs_dev_mean) # 1.2
上述代码中,将数据存储在一个 NumPy 数组中,计算了该数组的平均值 mean
,然后使用 abs()
函数计算了每个数据与 mean
之差的绝对值,存储在一个新的 NumPy 数组 abs_dev
中。
最后使用 mean()
函数计算了 abs_dev
的平均值 abs_dev_mean
,这个值就是数据的绝对偏差。
绝对平均偏差(Mean Absolute Deviation 或者 Mean Absolute Deviation from the Median)指每个数据与中位数之差的绝对值的平均值。
可以使用 NumPy 中的 median()
函数计算数据的中位数,然后使用 abs()
函数计算每个数据与中位数之差的绝对值,并使用 mean()
函数取得平均值。
import numpy as np
data = np.array([1, 2, 3, 4, 5])
median = np.median(data)
abs_dev = np.abs(data - median)
abs_dev_mean = np.mean(abs_dev)
print(abs_dev) # [2.0 1.0 0.0 1.0 2.0]
print(abs_dev_mean) # 1.2
上述代码中,计算了数据的中位数 median
,然后使用 abs()
函数计算了每个数据与 median
之差的绝对值,存储在一个新的 NumPy 数组 abs_dev
中。
最后使用 mean()
函数计算了 abs_dev
的平均值 abs_dev_mean
,这个值就是数据的绝对平均偏差。
通过本文的介绍,我们学习了如何使用 NumPy 计算数据的绝对偏差和绝对平均偏差。
数据的偏差对于数据的分布情况有很重要的影响,了解偏差有助于我们更好地进行数据分析和建模。