📅  最后修改于: 2023-12-03 15:03:30.817000             🧑  作者: Mango
介绍: 在统计学中,IQR(四分位数间距)是指第三四分位数(75%分位数)和第一四分位数(25%分位数)之间的距离,即IQR = Q3 - Q1。IQR是一种较为常用的测量数据的离散程度的方法,用来刻画样本数据的分布情况。
在pandas中,我们可以通过Series或DataFrame对象的quantile()方法来计算某个百分位数所对应的数值,进而计算IQR。
以下是使用pandas计算IQR的示例代码。
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({'Score': [85, 92, 78, 90, 85, 89, 76, 95, 83, 90, 87]})
# 计算第一四分位数(25%分位数)
Q1 = df['Score'].quantile(0.25)
# 计算第三四分位数(75%分位数)
Q3 = df['Score'].quantile(0.75)
# 计算IQR
IQR = Q3 - Q1
# 输出结果
print('IQR:', IQR)
上面的代码中,我们首先创建了一个DataFrame对象df,其中包含了一个名为Score的列,表示某个考试中某个学生的分数。然后,我们调用quantile()方法来计算第一四分位数和第三四分位数,最后计算IQR并输出结果。
注意,quantile()方法的参数指定了要计算的百分位数(在0~1之间),例如0.25表示计算25%分位数。