📜  使用 NumPy 的绝对偏差和绝对平均偏差 | Python(1)

📅  最后修改于: 2023-12-03 14:49:43.903000             🧑  作者: Mango

使用 NumPy 的绝对偏差和绝对平均偏差 | Python

简介

在统计学中,偏差是指样本或数据的平均值与真值(总体平均值)之间的差异。了解数据的偏差有助于我们更好地理解数据的分布情况。

本文主要介绍如何使用 NumPy 计算数据的绝对偏差和绝对平均偏差。

绝对偏差

绝对偏差(Absolute Deviation)指每个数据与数据的平均值之差的绝对值。

可以使用 NumPy 中的 abs() 函数计算数据与数据的平均值之差的绝对值,并使用 mean() 函数取得平均值。

import numpy as np

data = np.array([1, 2, 3, 4, 5])
mean = np.mean(data)
abs_dev = np.abs(data - mean)
abs_dev_mean = np.mean(abs_dev)
print(abs_dev)  # [2.0 1.0 0.0 1.0 2.0]
print(abs_dev_mean)  # 1.2

上述代码中,将数据存储在一个 NumPy 数组中,计算了该数组的平均值 mean,然后使用 abs() 函数计算了每个数据与 mean 之差的绝对值,存储在一个新的 NumPy 数组 abs_dev 中。

最后使用 mean() 函数计算了 abs_dev 的平均值 abs_dev_mean,这个值就是数据的绝对偏差。

绝对平均偏差

绝对平均偏差(Mean Absolute Deviation 或者 Mean Absolute Deviation from the Median)指每个数据与中位数之差的绝对值的平均值。

可以使用 NumPy 中的 median() 函数计算数据的中位数,然后使用 abs() 函数计算每个数据与中位数之差的绝对值,并使用 mean() 函数取得平均值。

import numpy as np

data = np.array([1, 2, 3, 4, 5])
median = np.median(data)
abs_dev = np.abs(data - median)
abs_dev_mean = np.mean(abs_dev)
print(abs_dev)  # [2.0 1.0 0.0 1.0 2.0]
print(abs_dev_mean)  # 1.2

上述代码中,计算了数据的中位数 median,然后使用 abs() 函数计算了每个数据与 median 之差的绝对值,存储在一个新的 NumPy 数组 abs_dev 中。

最后使用 mean() 函数计算了 abs_dev 的平均值 abs_dev_mean,这个值就是数据的绝对平均偏差。

结论

通过本文的介绍,我们学习了如何使用 NumPy 计算数据的绝对偏差和绝对平均偏差。

数据的偏差对于数据的分布情况有很重要的影响,了解偏差有助于我们更好地进行数据分析和建模。