📜  统计-数据模式

📅  最后修改于: 2021-01-23 06:35:19             🧑  作者: Mango


数据模式以图形方式绘制时非常有用。数据模式通常根据中心,展开,形状和其他异常属性等特征来描述。其他特殊的描述性标签是对称,钟形,倾斜等。

中央

图形上的分布中心位于分布的中位数。这样的图形图表显示几乎一半的观测值在任一侧。每列的高度指示观察的频率。

中心数据模式

传播

分布的扩展是指数据的变化。如果这组观察范围很广,则传播范围更大。如果观测值以单个值为中心,则分布较小。

传播数据模式

形状

分布的形状可以使用以下特征来描述。

  • 对称性-在对称分布中,图形可以在中心进行分割,使得每一半都是另一半的镜像。

    对称

  • 峰数。 -具有一个或多个峰值的分布。具有一个净峰的分布称为单峰,而具有两个净峰的分布称为双峰。中心的单个峰对称分布称为钟形。

    峰数

  • 偏度-一些分布可能在图形的一侧而不是另一侧具有多个观测值。对较低值的观察较少的分布被认为是正确的。较少观察值向较低值的分布被称为左偏。

    偏度

  • 均匀-当一组观测值没有峰值并且数据均匀分布在分布范围内时,该分布称为均匀分布。

    制服

不寻常的功能

数据模式的常见异常特征是差距和离群值。

  • 缺口-缺口指向没有观测值的分布区域。下图存在差距,因为在分布的中间没有观察到。

    缝隙

  • 离群值-分布的特征可能是极端值,该极端值与另一组观测数据有很大不同。这些极值称为离群值。下图说明了一个异常值的分布。

    离群值