在统计学中,主要使用五位数摘要,因为它可以粗略地了解数据集。它基本上是数据集的摘要,描述了统计中的一些关键特征。五个主要特点是:
- 最小值:是数据集中的最小值
- 第一四分位数,Q1:它也被称为下四分位数,其中 25% 的分数低于它。
- 中值(中间值)或第二个四分位数:它基本上是数据集中的中间值。
- 第三四分位数,Q3:也称为上四分位数,其中 25% 的数据高于它,其余 75% 的数据低于它。
- 最大值:数据集中的最大值。
需要注意的是,我们只能找到单个变量数据集的五数汇总。为两个变量数据也称为二元数据计算五数汇总是没有意义的。
这五个数字摘要给出了关于数据集分布的简明推断。使用这些四分位数,我们可以找到四分位距并从中创建一个箱线图。有关更多详细信息,请参阅在 Excel 中创建箱线图。
在本文中,我们将通过一个合适的示例讨论如何在 Excel 中计算五位数汇总。
执行 :
以下 Excel 内置函数可用于计算上述四分位数。
QUARTILE(Array,quart) // Used in Excel 2007 version and lower
Array : Cell range
quart : The five quart values from 0 to 4
0- Minimum value
1- First Quartile (25 percent)
2- Median Value (50 percentile)
3- Third Quartile (75 percentile)
4- Maximum value
在最新版本的 Excel 中,我们使用该函数
QUARTILE.INC(Array,quart)
参数和夸脱值与上面讨论的相同。
要计算最小值、最大值和中值,我们还可以使用以下函数:
=MIN(Array) //to calculate minimum value
=MAX(Array) //to calculate maximum value
=MEDIAN(Array) //to calculate second quartile or the median
示例:考虑由 10 个极客的 BMI 信息组成的数据集。
计算:
1. 最小值和最大值
它可以使用MIN、MAX函数或使用QUARTILE函数来计算,其中夸脱值为 0 表示最小值,4 表示最大值。
数据集存储在工作表的“A”列中,观察值存储在单元格A2 到 A11 中。
所以数组将从 A2 开始并在 A11 结束。
同样,我们可以找到最大值。
2. 中值或第二四分位数
可以使用 Excel函数MEDIAN或者我们可以使用QUARTILE函数,夸脱值为 2 。
3. 四分位数 Q1 和 Q3
函数QUARTILE或QUARTILE.INC用于计算这些四分位数值,其中 Q1 为 1,Q3 为 3。
概括
计算所有五数汇总:
Quartile Values | Formula |
Minimum Value | =QUARTILE.INC(Cell_Range, 0) |
Q1 | =QUARTILE.INC(Cell_Range, 1) |
Median | =QUARTILE.INC(Cell_Range, 2) |
Q3 | =QUARTILE.INC(Cell_Range, 3) |
Maximum Value | =QUARTILE.INC(Cell_Range, 4) |