在统计学中,主要使用五位数摘要,因为它可以粗略地了解数据集。它基本上是数据集的摘要,描述了统计中的一些关键特征。五个主要特点是:
- 最小值:数据集中的最小值。
- 第一四分位数,Q1 :它也被称为下四分位数,其中 25% 的分数低于它。
- 中值(中间值)或第二四分位数:它基本上是数据集中的中间值。
- 第三四分位数,Q3 :也称为上四分位数,其中 25% 的数据高于它,其余 75% 的数据低于它。
- 最大值:数据集中的最大值。
使用五位数汇总的两个四分位数,我们可以轻松计算缩写为Interquartile Range的IQR 。
在本文中,我们将以示例数据集为例,了解如何在 Excel 中计算四分位距。
四分位距
在数学上,基本定义为第三个四分位数(75th percentile)和第一个四分位数(25th percentile)之间的差值。
Q3-Q1
IQR表示中间50%,因此也被称为midspread或H-传播中的统计信息。使用箱线图可以很容易地观察到。
矩形箱线图的垂直线表示位于四分位 1 和四分位 3 之间的四分位距。
示例:考虑由班级中 10 名学生的 BMI 组成的数据集。
现在,为了计算 IQR,我们需要首先计算两个四分位数Q1 和 Q3 。使用的函数是:
QUARTILE(Array,quart) // Used in Excel 2007 version and lower
or
QUARTILE.INC(Array,quart) // Used in latest version of Excel
Array : Cell range
quart : The five quart values from 0 to 4
0- Minimum value
1- First Quartile (25 percent)
2- Median Value (50 percentile)
3- Third Quartile (75 percentile)
4- Maximum value
计算
按照以下步骤进行计算:
第一步:插入数据集。
步骤 2:选择要在其中编写公式以计算 Q1、Q3 和 IQR 值的任何单元格。
步骤 3:首先使用夸脱值分别为 1 和 3 找到 Q1 和 Q3 的值。
数据集存储在工作表的“A”列中,观察值存储在单元格A2 到 A11 中。
所以数组将从 A2 开始并在 A11 结束。
您还可以使用相同的公式通过更改夸脱值来找到五位数汇总的其余三个参数。但是要找到 IQR,我们只需要Q1 和 Q3的值。
Q3 的值存储在单元格 D4 中,Q1 的值存储在单元格 D3 中。公式将是:
=Cell_no_Q3-Cell_no_Q1
上述数据集的四分位距为6.5 。