📜  Python| Pandas Series.kurtosis()(1)

📅  最后修改于: 2023-12-03 15:34:16.314000             🧑  作者: Mango

Python | Pandas Series.kurtosis()

概述

Pandas Series.kurtosis() 函数计算序列的峰度(kurtosis),该函数默认使用“Fisher's definition of kurtosis”,计算公式为 $kurt(x) = \frac{1}{n} \sum_{i=1}^n \frac{(x_i - \bar{x})^4}{s^4} - 3$,其中 $\bar{x}$ 是序列的均值,$s$ 是序列的标准差,$n$ 是序列长度。

语法
Series.kurtosis(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
参数
  • axis:指定计算峰度的轴,默认为 None,表示计算整个序列的峰度。
  • skipna:指定是否忽略缺失值,默认为 None,表示不忽略缺失值。
  • level:指定计算峰度的级别(如果输入的序列是层次化索引的),默认为 None
  • numeric_only:指定是否仅计算数值型数据的峰度,默认为 None,表示计算所有数据的峰度。
返回值

返回计算出的序列峰度值。

示例
import pandas as pd

s = pd.Series([4, 7, 2, 9, 10, 12])
print(s.kurtosis())
# 输出:-1.471008196721312

s = pd.Series([1, 1, 1, 1, 1])
print(s.kurtosis())
# 输出:-3.0

在第一个示例中,计算了一个包含六个数的序列的峰度。结果显示,该序列的峰度值为 -1.47。由于这个值小于 0,因此可以说该序列比正态分布要扁平一些。

在第二个示例中,计算了一个包含五个 1 的序列的峰度。结果显示,该序列的峰度值为 -3,符合预期,因为对于所有值都相等的序列,其峰度值总是 -3。

注意,由于峰度的计算与数据分布的形态有关,因此峰度值并不能直接用于说明数据的分布形态,需要结合其他指标一起使用。