📜  分组数据的均值,中位数和模式

📅  最后修改于: 2021-06-22 20:24:15             🧑  作者: Mango

假设我们要比较两所学校的学生年龄,并确定哪所学校的学生年龄更大。如果我们根据个别学生进行比较,我们将无法得出任何结论。但是,如果对于给定的数据,我们得到代表数据特征的代表值,则比较变得容易。

代表整个数据并表示其特征的某个值称为数据的平均值。三种类型的平均值可用于分析数据。

他们是:

(我是说

(ii)中位数

(iii)模式

在本文中,我们将研究三种类型的平均值以进行数据分析。

吝啬的

观测值的平均值(或平均值)是所有观测值的总和除以观测总数。

数据的平均值由x = f 1 x 1 + f 2 x 2 +…….. + f n x n / f1 + f2 +……….. + fn给出

计算均值的方法

方法1:直接计算均值的方法

步骤1:对于每个类别,找到类别标记x i ,为

x = 1/2(下限+上限)

步骤2:计算F I .X对于每个i。

步骤3:使用公式Mean = ∑(f i .x i )/ ∑f i

示例:找到以下数据的平均值。

Class Interval

0-10

10-20

20-30

30-40

40-50

Frequency

12

16

6

7

9

解决方案:

方法2:假定–均值计算均值的方法

为了计算这种情况下的均值,我们按以下步骤进行。

步骤1:对于每个类别间隔,使用以下公式计算类别标记x: x i = 1/2(下限+上限)。

步骤2:选择合适的均值并在中间用A. x表示,作为假设均值并在A中表示。

步骤3:计算每个i的偏差d i =(x,-A)。

步骤4:计算每个i的乘积(f i xd i)。

步骤5:找出n = ∑f i

步骤6:使用以下公式计算平均值x: X = A + ∑f i d i / n

示例:使用假设均值方法,找到以下数据的均值:

Class Interval

Frequency  fi

Class Mark xi

( fi.xi )

0-10

12

5

60

10-20

16

15

240

20-30

6

25

150

30-40

7

35

245

40-50

9

45

405

 

∑fi=50

 

∑fi.xi=1100

解决方案:

方法3:逐步偏离法计算均值

当x和f的值较大时,通过上述方法进行均值的计算变得繁琐。在这种情况下,我们将使用下面给出的逐步偏离方法。

步骤1:对于每个班级间隔,计算班级标记x,其中X = 1/2(下限+上限)。

步骤2:在x列的中间选择一个合适的x值作为假设均值,并用A表示。

步骤3:计算h = [(上限)-(下限)],所有类均相同。

步骤4:为每个类别计算u i =(x i -A)/ h。

步骤5:为每个类别计算fu,从而找到∑(f i xu i )。

步骤6:使用以下公式计算平均值: x = A + {hx ∑(f i xu i )/ ∑f i }

示例:找到以下频率分布的平均值:

Class Interval

0-10

10-20

20-30

30-40

40-50

Frequency

7

8

12

13

10

解决方案:

中位数

我们首先以升序排列观测数据的给定数据值。然后,如果n为奇数,则中位数为(n + 1/2)。如果n是偶数,则中位数将是第n / 2个和第(n / 2 +1)个观测值的平均值。

示例:计算以下频率分布的中值。

Class Interval

Frequency

fi

Mid value

xi

Deviation

di=(xi-25)

(fixdi)
0-10 7 5 -20 -140
10-20 8 15 -10 -80
20-30 12 25=A 0 0
30-40 13 35 10 130
40-50 10 45 20 200
  ∑fi=50     ∑(fixdi)=100

解决方案:

模式

正是最经常出现的变量值。更准确地说,模式是数据集中度最大的变量的值。

模态类别:在频率分布中,具有最大频率的类别称为模态类别。

示例1:计算以下频率分布的模式。

Class

50-70

70-90

90-110

110-130

130-150

150-170

Frequency

18

12

13

27

8

22

解决方案:

示例2:找到以下数据的均值,众数和中位数,

Class

Frequency

fi

Mid Value

xi

ui=(xi-A)/h

=(xi-100)20

(fixui)

50-70

18

60

-2

-36

70-90

12

80

-1

-12

90-110

13

100=A

0

0

110-130

27

120

1

27

130-150

8

140

2

16

150-170

22

160

3

66

 

∑fi=100

 

 

∑(fixui)=61

解决方案:

让一个分组的频率分布给我们。在方格纸上,我们在x轴上标记上限,在y轴上标记相应的累积频率。通过线段依次连接这些点时,我们得到一个多边形,称为累积频率多边形。通过平滑曲线依次连接这些点时,我们得到一条曲线,称为ogive。

逐步生成Ogive图的过程

  1. 首先,我们在水平x轴上标记类别间隔的上限,并在y轴上标记其相应的累积频率。
  2. 现在绘制由(上限,累积频率)给出的有序对的所有对应点。
  3. 徒手将所有要点连接起来。
  4. 我们得到的曲线称为ogive。

杂物的类型

1)少于原始

在方格纸上,我们在x轴上标记上限,在y轴上标记相应的累积频率。

(i)通过线段依次连接这些点时,我们得到一个多边形,称为累积频率多边形。

(ii)通过平滑曲线连续连接这些点时,我们得到一条曲线,称为小于曲线。

2)比Ogive还多

在方格纸上,我们在x轴上标记了下限类别,在y轴上标记了相应的累积频率。

(i)通过线段依次连接这些点时,我们得到一个多边形,称为累积频率多边形。

(ii)通过平滑曲线依次连接这些点时,我们会得到一条曲线,称为曲线