📜  统计-峰度(1)

📅  最后修改于: 2023-12-03 14:56:56.281000             🧑  作者: Mango

统计 - 峰度

介绍

在统计学中,峰度(Kurtosis)是对数据分布偏离正态分布的程度的度量,通俗地说,它是描述数据分布形态“瘦高”或“平阔”的度量。峰度告诉我们数据分布在均值附近的集中程度,以及数据分布的尖锐程度。

公式

峰度的计算公式如下:

峰度公式

其中,μ2为二阶中心矩(也称作方差),μ4为四阶中心矩。

峰度值的解释
  • 峰度 > 3,表明数据分布较为集中、尖锐,比正态分布更加“瘦高”(例如t分布的峰度就大于3);
  • 峰度 < 3,表明数据分布相对平均、平坦,比正态分布更加“丰满”;
  • 峰度 = 3,表明数据分布近似正态分布。
Python 中的实现

在Python中,我们可以使用scipy库的kurtosis函数来计算峰度值:

from scipy.stats import kurtosis

data = [1, 2, 3, 4, 5]
print("峰度值为:", kurtosis(data))

输出结果为:

峰度值为: -1.3
总结

峰度是一种反映数据分布形态的度量,并可以与正态分布进行比较。在统计分析中,峰度也是一个重要的概念,对于一些特定的分布,比如t分布,其峰度值比正态分布更为显著。掌握峰度的计算公式和解释,可以更好地了解和分析数据分布。