📜  统计-四分位数偏差(1)

📅  最后修改于: 2023-12-03 14:56:56.218000             🧑  作者: Mango

统计-四分位数偏差

四分位数偏差(Interquartile Range,IQR)是统计学的概念之一,它是数据集上四分位数之间的差距。IQR通常被用来衡量数据集的离散程度,因为它避免了离群点的影响。

公式

IQR的计算公式为:

IQR = Q3 - Q1

其中,Q1是数据集的下四分位数,Q3是数据集的上四分位数。

实现

下面是Python中计算IQR的实现代码:

def iqr(data):
    q1, q3 = np.percentile(data, [25, 75])
    return q3 - q1

以上代码使用了NumPy库中的percentile函数,该函数用于计算数据集在给定百分位数处的值。在本例中,[25, 75]表示要计算数据集的下四分位数(25%分位数)和上四分位数(75%分位数)。

示例

以下是一个示例,展示如何使用上述代码计算IQR:

import numpy as np

data = np.array([3, 1, 2, 4, 5, 6, 7, 9, 8])
iqr_value = iqr(data)
print(iqr_value)

以上代码输出结果为:

4.0
注意事项
  • 数据集必须是一维数组或列表。
  • percentile函数返回的是浮点数,因此IQR的结果也是浮点数。