收集数据并以表格,图表和其他分布形式表示对我们来说至关重要。但是,同样重要的是,我们必须对数据的分布方式,分散程度以及数据的含义有一个公正的认识。均值的度量还不足以描述数据及其性质。我们还需要针对数据的不同统计量来测量数据中的离散度。例如,我们需要能够回答以下问题:周围数据的均值或其中位数的分散程度是多少。这些值使我们可以更好地描述数据。让我们来看一些
分散度(也称为分散度)是根据选定的中心趋势的类型和我们可用的观测值进行测量的。这些度量告诉我们观察值有多少不同或彼此相似。有许多方法可以测量数据的离散度,以下是一些主要的方法来测量散度:
- 范围
- 方差
- 标准偏差
范围
数据范围以数据中观测值的最大值和最小值之差给出。举例来说,假设我们有一周内在商店中走访的顾客数量的数据。
10、14、8、10、15、4、7
数据最小值= 7
数据中的最大值= 15
范围=数据中的最大值–数据中的最小值
= 15 – 7
= 8
现在我们可以说数据的范围是8。这使我们对数据的分布有一个了解,但没有说明数据的分布方式。
方差
通过测量观测值与分布平均值的距离来给出数据的方差。在这里,我们与点的距离的符号无关,而对幅度更感兴趣。因此,我们采用距均值的距离的平方。假设我们有x 1 ,x 2 ,x 3 …。 x n作为n个观测值,并且是卑鄙的。
如果该总和为零,则每个项必须为零,这意味着数据中没有散射。如果很小,则意味着对于大的方差值,数据集中在平均值上,反之亦然。
但是,此度量仍然取决于数据中的观察次数。也就是说,如果有很多观察,则该值将变大。因此,我们取数据的平均值,
标准偏差
在计算方差时,请注意方差的单位和观察值的单位不相同。因此,为消除此问题,我们定义了标准偏差。表示为
让我们看看如何在某些问题中计算这些度量,
样本问题
问题1:找出以下数据的范围:
-4 | 5 | -10 | 6 | 9 |
解决方案:
For calculating the range of a data, we need to find out the maximum and the minimum of the data:
Max = 9
Min = -10
Range = Max – Min
= 9 -(-10)
= 19
问题2:找出相同数据的均值和中位数:
-4 | 5 | -10 | 6 | 9 |
解决方案:
Mean of the data:
=
= 1.2
Median is called the middle element of the data.
Median = -10.
问题3:假设我们有以下数据,
-4 | -2 | 0 | -2 | 6 | 4 | 6 | 0 | -6 | 4 |
计算数据的范围,方差和标准偏差。
解决方案:
Range
We need to find out the minimum and the maximum values of the data distribution.
Min Value = -6
Max Value = +6
Range = Max Value – Min Value
= 6 – (-6)
= 12
Variance
To find the variance, we first need to find the mean,
Mean =
=
= 0.6
We know the formula for Variance,
Variance =
=
=
= 17.82
Standard Deviation
⇒
⇒
问题4:假设我们有以下数据,
-3 | -3 | -3 | -3 | 0 | 3 | 3 | 3 | 3 |
计算数据的范围,方差和标准偏差。
解决方案:
Range
We need to find out the minimum and the maximum values of the data distribution.
Min Value = -3
Max Value = +3
Range = Max Value – Min Value
= 3 – (-3)
= 6
Variance
To find the variance, we first need to find the mean,
Mean =
= 0
We know the formula for Variance,
Variance =
=
=
= 9
Standard Deviation
⇒
⇒
问题5:假设我们有以下有关消费电子商店一周内销售的电视数量的数据,
Monday | 4 |
Tuesday | 5 |
Wednesday | 3 |
Thursday | 4 |
Friday | 5 |
Saturday | 5 |
Sunday | 3 |
计算数据的范围,方差和标准偏差。
解决方案:
Range
We need to find out the minimum and the maximum values of the data distribution.
Min Value = 3
Max Value = +5
Range = Max Value – Min Value
= 5 – (3)
= 2
Variance
To find the variance, we first need to find the mean,
Mean =
=
= 2.9
We know the formula for Variance,
Variance =
=
= 0.809
Standard Deviation
⇒
⇒