📜  方差和标准偏差–概率| 11年级数学

📅  最后修改于: 2021-06-22 23:59:13             🧑  作者: Mango

标准差和方差是在值集中分布的两种最常用的度量。一组数字的标准偏差(σ)是这些数字散布的程度。通过计算方差的平方根来获得标准偏差的值。一组数字的方差是该组中每个值偏离均值的平均程度。换句话说,它等于值与其平均值的平方差的平均值。

未分组数据的标准偏差和方差

未分组数据的方差计算如下:

  1. 计算所提供值的平均值。
  2. 计算每个值与平均值之间的差。这种差异也称为均值偏差。
  3. 对在步骤2中获得的每个值求平方,并对所有平方值求和。
  4. 将计算出的总和除以平均值。

用于显示方差的公式如下所示:

V=\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n}

其中x̄是平均值,n是集合中值的数量。
要计算标准差(σ),我们首先使用前面的步骤计算方差,然后计算其平方根:

\sigma =\sqrt{\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n}} = \sqrt{V}

色散量度:范围,偏差和方差

统计分散是一组值散布的程度。方差,标准偏差和范围(即数据集中最大值和最小值之间的差)都是分散度度量的示例。范围,标准偏差和方差越大,值的离散度越大。

范围,方差和标准偏差的样本问题

以下示例说明了这三个概念。我们假设两组随机数:Set1 = {1、3、7、9、11、15},Set2 = {10、20、33、67、82}

示例1:此示例说明如何计算数据集的范围。

解决方案:

示例2:此示例说明如何计算数据集的方差

解决方案:

示例3:此示例说明了如何计算标准偏差。

解决方案:

分组数据的范围和均值偏差

分组的数据分为两种类型:第一种是连续频率分布,其中将值分组为间隔,每个间隔与一个频率值关联。第二种是离散频率分布,其中每个值都与一个频率值相关联。

范围

  • 为了计算连续频率分布的范围,我们计算了最小间隔的下限和最大间隔的上限之差。假设最小间隔为(a -f),最大间隔为(v – z):
  • 对于离散的频率分布,我们只需计算出最小值(S)和最大值(L)之间的差即可:

吝啬的

  • 要计算连续频率分布的平均值,我们取每个间隔中心的值,然后将每个值乘以其间隔的频率值。然后,我们对这些值求和,然后将总和乘以值的总数(所有频率值的总和)。使用以下公式:
  • 离散频率分布的均值计算与连续频率分布的均值计算相同,但有一个区别。离散频率分布具有离散值而不是间隔。因此,我们将每个离散值乘以其频率值,然后将这些乘积相加并除以总频率值,而不是取一个间隔中心的值。使用相同的公式。但是,在这种情况下,xi是离散值i,fi是离散值i的频率。

平均偏差

  • 为了计算连续频率分布的均值偏差,我们计算了每个间隔的中点与均值之间的差。然后,我们将每个差乘以间隔的频率,然后将所有产生的值相加。最后,我们将总和除以值的总数(总频率)。使用以下公式:
  • 离散频率分布的均值偏差的计算与连续频率分布的均值的计算相同,但是我们不取间隔中间的值,而是取每个离散值,计算出该值与均值之差,将差值与离散值的频率相乘,然后将这些乘积相加并除以总频率值。使用相同的公式。但是,在这种情况下,xi是离散值i,fi是离散值i的频率。

均值,中位数和众数的计算

平均值,中位数和众数可以告诉我们哪个值可以代表数据集,每种值均以不同的方式表示。下面解释这三种集中趋势的度量:

  • 为了计算平均值,我们将值的总和除以给定值的数量。

Mean =\frac{\sum_{}x_i}{n}

  • 中位数基本上是当集合按升序或降序排列时在数据集中心的数字。在具有多个值n的数据集中:
    如果n是一个奇数,我们计算(n-1 / 2)。考虑到第一个值的索引为1,第二个值为2,依此类推,所得索引的值为中间值。
    如果n是偶数,则将索引(n / 2)和(n / 2 +1)处的值相加,然后将和除以2得到平均值。该值是集合的中位数
  • 模式是一组值中最频繁的数字

样本问题

问题1:给定一组未分组的值{7,8,3,6,7,8,9,9,7,5,-2}。计算该集合的均值,中位数和众数。

解决方案:

示例2给定一组未分组的值{1、4、9、9、6、30、21、6、1}。计算该集合的均值,中位数和众数。

解决方案:

示例3给定一组具有连续频率分布的分组数据:

Interval (class) Frequency
2-4 3
4-6 4
6-8 2

计算范围,均值和均值偏差。

解决方案:

示例4给定一组具有离散频率分布的分组数据:

Value(class) Frequency
1 3
5 4
7 2

计算范围,均值和均值偏差。

解决方案: