📅  最后修改于: 2021-01-23 06:35:19             🧑  作者: Mango
数据模式以图形方式绘制时非常有用。数据模式通常根据中心,展开,形状和其他异常属性等特征来描述。其他特殊的描述性标签是对称,钟形,倾斜等。
图形上的分布中心位于分布的中位数。这样的图形图表显示几乎一半的观测值在任一侧。每列的高度指示观察的频率。
分布的扩展是指数据的变化。如果这组观察范围很广,则传播范围更大。如果观测值以单个值为中心,则分布较小。
分布的形状可以使用以下特征来描述。
对称性-在对称分布中,图形可以在中心进行分割,使得每一半都是另一半的镜像。
峰数。 -具有一个或多个峰值的分布。具有一个净峰的分布称为单峰,而具有两个净峰的分布称为双峰。中心的单个峰对称分布称为钟形。
偏度-一些分布可能在图形的一侧而不是另一侧具有多个观测值。对较低值的观察较少的分布被认为是正确的。较少观察值向较低值的分布被称为左偏。
均匀-当一组观测值没有峰值并且数据均匀分布在分布范围内时,该分布称为均匀分布。
数据模式的常见异常特征是差距和离群值。
缺口-缺口指向没有观测值的分布区域。下图存在差距,因为在分布的中间没有观察到。
离群值-分布的特征可能是极端值,该极端值与另一组观测数据有很大不同。这些极值称为离群值。下图说明了一个异常值的分布。