📜  哪种集中趋势度量与 ogives 相关?

📅  最后修改于: 2022-05-13 01:54:14.340000             🧑  作者: Mango

哪种集中趋势度量与 ogives 相关?

在统计数据中,数据集的描述性总结称为集中趋势。它被认为是数据分布中心的指标。总而言之,它代表整个分布或数据集的单个值。它准确地描述了数据。

但是,数据分布的集中趋势并未提供有关数据集中单个数据的信息。有多种衡量数据集中趋势的方法。

集中趋势测度

既然我们描述了,数据的集中趋势作为一个指标的值,通过计算数据的中心位置来描述数据集。数据的集中趋势可以通过以下量来衡量:

  • 平均值:平均值被认为是所有观测值的总和除以观测值的总数。
  • 中位数:中位数定义为有序集中的中间值或中心值。
  • 众数众数定义为数据集中出现频率最高的值。

奥格

特定数据分布的 Ogive 定义为一系列的频率分布图。任何累积分布的 Ogive 都可以构建为图表,解释水平轴上的数据值。它甚至可以在垂直轴上描绘累积频率或相对频率,甚至累积百分比频率。

例如,可以使用 Ogive 曲线轻松绘制特定频率范围内给定数据分布的流行度,这有助于非常准确地找到这些细节。因此,它用于对数据的可能性做出准确的精确度。

Ogive 是通过绘制对应于每个类间隔的累积频率的点来构造的。它以图画形式描绘。它基本上提供了对小于等于给定指定值的观察数量的估计。

Ogive的类型

Ogive 被定义为以表格形式显示的总频率,分布在类间隔中。基本上有两种不同类型的 ogive,即小于和大于。

小于 Ogive

在小于 ove 中,通过连续添加属于所有先前类别的频率来获得和描绘图。它还包括它所属的类。这种类型的 ogive 的观察次数少于上层阶级的边界。我们从最低到最高尺寸开始累积。

大于奥吉夫

也称为超过类型 ogive,这种类型的 ogive 具有大于或等于类的较小边界的观察数。这种类型的 ogive 与小于 ogive 正好相反。它可以通过计算从最高级别开始到最低级别的频率的累积总数来获得。

构建Ogive 图表

描述和绘制属于不同值或类别的累积频率的简单可视化方式是构建 ogive 图表的一部分。构建 ogive 图表涉及多个步骤:

  1. 使用连续变量计算合适类别长度的频率分布表。
  2. 计算每个类间隔的频率。
  3. 计算每个类间隔的端点。 (上限或下限)。
  4. 这些数字被添加到频率列中以计算数据分布的累积频率。
  5. 以表格格式存储结果。

Ogive曲线的用途

Ogive Graph 或累积频率图用于查找给定数据集的中位数。如果在同一张图上同时绘制小于和大于累积频率曲线,我们可以很容易地找到中值。两条曲线相交的点对应于 x 轴,给出中值。除了找到中位数之外,Ogives 还用于计算数据集值的百分位数。

中位数

数据集或数据分布的中位数定义为集合中最中间的数字或中心值。中位数是升序排序数据的平均值。中位数是排序数据的计算平均值。在数据已经按升序可用的情况下,中值衡量数据的集中趋势。它可以被认为是数据分布中心的指标。

但是,数据的中位数对数据的排列给出了轻微的估计,这意味着中位数左侧的值小于它,同样,媒体右侧的值大于中位数。数据集的中位数可能不是唯一的。

为了计算给定数据分布的中位数,首先手动将数据集按升序排序。数据现在按从最低值到最高值的值排列。中位数可以被认为是由数据样本的上半部分与下半部分分开的数字。中位数因不同类型的数据分布而异。对于奇数个观测值,数据的中位数是排序数据的中间值。对于具有偶数个观测值的数据集,中位数是中间两个值的平均值。

例如,给定数据值 3、3、5、9、11 的中位数为 5。由于存在偶数个观测值,因此中位数等于两个中间值的平均值或平均值,因此 , 3、5、7、9 的中位数为 (5+7)/2 = 6。

要在 ogive 上找到中位数,请按照下列步骤操作:

  1. 所有的点都被绘制出来,然后用线相应地连接起来。
  2. 的价值\frac{N}{2}  被计算。
  3. 该值标记在累积频率刻度(y 轴)中。
  4. 该值与用虚线绘制点形成的线相连。
  5. 使用直线虚线将此点连接到 x 轴点。
  6. 交点是中位数。

示例问题

问题 1. 计算以下数据的中位数:

2、5、7、3、11、9、12、4、1、15、2。

解决方案:

问题 2. 如何计算两个数字的中位数?

解决方案:

问题 3. 区分均值和中值?

解决方案:

Mean

Median

The average arithmetic of a given set of numbers The method of separating the higher sample with the lower value from a probability distribution
Used for normal distributionsUsed for skewed distributions.
There are a lot of external factors that limit the use of Mean.It is much more robust and reliable for measuring the data for uneven data.
calculated by adding all the values and dividing the total by the number of values.computed by listing all the numbers available in the set in arranging the order and then finding the number in the centre of the distribution.
arithmetic average.positional average.
It is highly sensitive to outlier dataIt is not much sensitive to the outlier data.

问题 4. 说明集中趋势的 4 个度量?

解决方案:

问题 5. 你如何找到集中趋势?

解决方案: