假设我们要比较两所学校的学生年龄,并确定哪所学校的学生年龄更大。如果我们根据个别学生进行比较,我们将无法得出任何结论。但是,如果对于给定的数据,我们得到代表数据特征的代表值,则比较变得容易。
代表整个数据并表示其特征的某个值称为数据的平均值。三种类型的平均值可用于分析数据。
他们是:
(我是说
(ii)中位数
(iii)模式
在本文中,我们将研究三种类型的平均值以进行数据分析。
吝啬的
观测值的平均值(或平均值)是所有观测值的总和除以观测总数。
数据的平均值由x = f 1 x 1 + f 2 x 2 +…….. + f n x n / f1 + f2 +……….. + fn给出
Mean Formula is given by
Mean= ∑(fi.xi)/∑fi
计算均值的方法
方法1:直接计算均值的方法
步骤1:对于每个类别,找到类别标记x i ,为
x = 1/2(下限+上限)
步骤2:计算F I .X我对于每个i。
步骤3:使用公式Mean = ∑(f i .x i )/ ∑f i
示例:找到以下数据的平均值。
Class Interval |
0-10 |
10-20 |
20-30 |
30-40 |
40-50 |
---|---|---|---|---|---|
Frequency |
12 |
16 |
6 |
7 |
9 |
解决方案:
We may prepare the table given below:
Mean=∑(fi.xi)/∑fi = 1100/50 = 22
方法2:假定–均值计算均值的方法
为了计算这种情况下的均值,我们按以下步骤进行。
步骤1:对于每个类别间隔,使用以下公式计算类别标记x: x i = 1/2(下限+上限)。
步骤2:选择合适的均值并在中间用A. x表示,作为假设均值并在A中表示。
步骤3:计算每个i的偏差d i =(x,-A)。
步骤4:计算每个i的乘积(f i xd i)。
步骤5:找出n = ∑f i
步骤6:使用以下公式计算平均值x: X = A + ∑f i d i / n
示例:使用假设均值方法,找到以下数据的均值:
Class Interval |
Frequency fi |
Class Mark xi |
( fi.xi ) |
---|---|---|---|
0-10 |
12 |
5 |
60 |
10-20 |
16 |
15 |
240 |
20-30 |
6 |
25 |
150 |
30-40 |
7 |
35 |
245 |
40-50 |
9 |
45 |
405 |
|
∑fi=50 |
|
∑fi.xi=1100 |
解决方案:
Let A=25 be the assumed mean. Then we have,
Mean = X = A+ ∑fidi/n = (25+110/50)=27.2
方法3:逐步偏离法计算均值
当x和f的值较大时,通过上述方法进行均值的计算变得繁琐。在这种情况下,我们将使用下面给出的逐步偏离方法。
步骤1:对于每个班级间隔,计算班级标记x,其中X = 1/2(下限+上限)。
步骤2:在x列的中间选择一个合适的x值作为假设均值,并用A表示。
步骤3:计算h = [(上限)-(下限)],所有类均相同。
步骤4:为每个类别计算u i =(x i -A)/ h。
步骤5:为每个类别计算fu,从而找到∑(f i xu i )。
步骤6:使用以下公式计算平均值: x = A + {hx ∑(f i xu i )/ ∑f i }
示例:找到以下频率分布的平均值:
Class Interval |
0-10 |
10-20 |
20-30 |
30-40 |
40-50 |
---|---|---|---|---|---|
Frequency |
7 |
8 |
12 |
13 |
10 |
解决方案:
We prepare the given table below,
A=100, h=20, ∑fi=100 and ∑(fi x ui)=61
x = A + {h x ∑(fi x ui) / ∑fi}
=100 + {20 + 61/100} = (100+12.2) =112.2
中位数
我们首先以升序排列观测数据的给定数据值。然后,如果n为奇数,则中位数为(n + 1/2)。如果n是偶数,则中位数将是第n / 2个和第(n / 2 +1)个观测值的平均值。
Formula for Calculating Median:
Median, Me = l + {h x (N/2 – cf )/f}
where,
l = lower limit of median class.
h=width of median class.
f = frequency of median class,
cf = cumulative frequency of the class preceding the median class.
N = ∑fi
示例:计算以下频率分布的中值。
Class Interval |
Frequency fi |
Mid value xi |
Deviation di=(xi-25) |
(fixdi) |
---|---|---|---|---|
0-10 | 7 | 5 | -20 | -140 |
10-20 | 8 | 15 | -10 | -80 |
20-30 | 12 | 25=A | 0 | 0 |
30-40 | 13 | 35 | 10 | 130 |
40-50 | 10 | 45 | 20 | 200 |
∑fi=50 | ∑(fixdi)=100 |
解决方案:
We may prepare cumulative frequency table as given below,
Class |
Frequency |
Cumulative Frequency |
---|---|---|
0-8 |
8 |
8 |
8-16 |
10 |
18 |
16-24 |
16 |
34 |
24-32 |
24 |
58 |
32-40 |
15 |
73 |
40-48 |
7 |
80 |
|
N=∑fi=80 |
|
Now, N = 80 = (N/2) = 40.
The cumulative frequency just greater than 40 is 58 and the corresponding class is 24-32.
Thus, the median class is 24-32.
l = 24, h = 8, f = 24, cf = c.f. of preceding class = 34, and (N/2) = 40.
Median, Me = l+ h{(N/2-cf)/f}
= 24+8 {(40 – 34)/ 24}
= 26
Hence, median = 26.
模式
正是最经常出现的变量值。更准确地说,模式是数据集中度最大的变量的值。
模态类别:在频率分布中,具有最大频率的类别称为模态类别。
Formula for Calculating Mode:
Mo = xk +h{(fk – fk-1)/(2fk -fk-1-fk+1)}
where,
xk = lower limit of the modal class interval.
fk = frequency of the modal class.
fk-1= frequency of the class preceding the modal class.
fk+1 = frequency of the class succeeding the modal class.
h=width of the class interval.
示例1:计算以下频率分布的模式。
Class |
50-70 |
70-90 |
90-110 |
110-130 |
130-150 |
150-170 |
---|---|---|---|---|---|---|
Frequency |
18 |
12 |
13 |
27 |
8 |
22 |
解决方案:
Class 40-50 has the maximum frequency, so it is called the modal class.
xk= 40, h=10, fk=28, fk-1=12, fk+1=20
Mode, Mo= xk +h{(fk – fk-1)/(2fk -fk-1-fk+1)}
= 40 +10{(28 – 12)/(2*28-12 – 20)}
= 46.67
Hence, mode= 46.67
Important Result-: Relationship among mean, median and mode.
Mode = 3(Median) – 2(Mean)
示例2:找到以下数据的均值,众数和中位数,
Class |
Frequency fi |
Mid Value xi |
ui=(xi-A)/h =(xi-100)20 |
(fixui) |
---|---|---|---|---|
50-70 |
18 |
60 |
-2 |
-36 |
70-90 |
12 |
80 |
-1 |
-12 |
90-110 |
13 |
100=A |
0 |
0 |
110-130 |
27 |
120 |
1 |
27 |
130-150 |
8 |
140 |
2 |
16 |
150-170 |
22 |
160 |
3 |
66 |
|
∑fi=100 |
|
|
∑(fixui)=61 |
解决方案:
We have,
Class |
Mid Value xi |
Frequency fi |
Cumulative Frequency |
fi . xi |
---|---|---|---|---|
0-10 |
5 |
8 |
8 |
40 |
10-20 |
15 |
16 |
24 |
240 |
20-30 |
25 |
36 |
60 |
900 |
30-40 |
35 |
34 |
94 |
1190 |
40-50 |
45 |
6 |
100 |
270 |
|
|
∑fi=100 |
|
∑fi. xi=2640 |
Mean = ∑(fi.xi)/∑f
=2640/100
= 26.4
Here, N =100 ⇒ N / 2 = 50.
Cumulative frequency just greater than 50 is 60 and corresponding class is 20-30.
Thus, the median class is 20-30.
Hence, l = 20, h = 10, f = 36, c = c. f. of preceding class = 24 and N/2=50
Median, Me = l+ h{(N/2-cf)/f}
= 20+10{(50-24)/36}
Median = 27.2.
Mode = 3(median) – 2(mean) = (3 × 27.2 – 2 × 26.4) = 28.8
卵
让一个分组的频率分布给我们。在方格纸上,我们在x轴上标记上限,在y轴上标记相应的累积频率。通过线段依次连接这些点时,我们得到一个多边形,称为累积频率多边形。通过平滑曲线依次连接这些点时,我们得到一条曲线,称为ogive。
逐步生成Ogive图的过程
- 首先,我们在水平x轴上标记类别间隔的上限,并在y轴上标记其相应的累积频率。
- 现在绘制由(上限,累积频率)给出的有序对的所有对应点。
- 徒手将所有要点连接起来。
- 我们得到的曲线称为ogive。
杂物的类型
1)少于原始
在方格纸上,我们在x轴上标记上限,在y轴上标记相应的累积频率。
(i)通过线段依次连接这些点时,我们得到一个多边形,称为累积频率多边形。
(ii)通过平滑曲线连续连接这些点时,我们得到一条曲线,称为小于曲线。
2)比Ogive还多
在方格纸上,我们在x轴上标记了下限类别,在y轴上标记了相应的累积频率。
(i)通过线段依次连接这些点时,我们得到一个多边形,称为累积频率多边形。
(ii)通过平滑曲线依次连接这些点时,我们会得到一条曲线,称为曲线。