📅  最后修改于: 2023-12-03 15:18:02.750000             🧑  作者: Mango
numpy.ma.anom()
函数用于计算沿着指定轴的数据的异常值。
异常值是指数据与平均值之间的偏差值(即“平均差”)。 数据范围超出6个标准偏差的点会被标记为异常值。
numpy.ma.anom(data, axis=None)
返回一个新的MaskedArray对象,其中包含数据的异常值。
import numpy.ma as ma
# 生成数据
x = [1, 2, 3, 4, 5, 1000]
# 创建遮蔽数组
mask = ma.masked_where(x > 100, x)
# 计算异常值
anoms = ma.anom(mask)
print(anoms)
输出:
[-- -- -- -- -- 378.3333333333333]
如果数据中没有异常值,则返回一组空数组。
该函数依赖于numpy.ma.average()
函数来计算平均值。 当使用此函数时,请注意数据的类型和范围。 如果范围大,则需要使用dtype='f8'
。
建议先使用numpy.ma.masked_where()
函数生成一个遮蔽数组,然后再计算异常值。
该函数可以用于识别被污染的数据点,以及在机器学习中进行数据清洗和异常检测。