Python| Pandas Series.kurtosis()(1)

📌 相关文章

📜 Python| Pandas Series.kurtosis()(1)

📅 最后修改于: 2023-12-03 15:34:16.314000 🧑 作者: Mango

Python | Pandas Series.kurtosis()

概述

Pandas Series.kurtosis() 函数计算序列的峰度（kurtosis），该函数默认使用“Fisher's definition of kurtosis”，计算公式为 $kurt(x) = \frac{1}{n} \sum_{i=1}^n \frac{(x_i - \bar{x})^4}{s^4} - 3$，其中 $\bar{x}$ 是序列的均值，$s$ 是序列的标准差，$n$ 是序列长度。

语法

Series.kurtosis(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

参数

axis：指定计算峰度的轴，默认为 None，表示计算整个序列的峰度。
skipna：指定是否忽略缺失值，默认为 None，表示不忽略缺失值。
level：指定计算峰度的级别（如果输入的序列是层次化索引的），默认为 None。
numeric_only：指定是否仅计算数值型数据的峰度，默认为 None，表示计算所有数据的峰度。

返回值

返回计算出的序列峰度值。

示例

import pandas as pd

s = pd.Series([4, 7, 2, 9, 10, 12])
print(s.kurtosis())
# 输出：-1.471008196721312

s = pd.Series([1, 1, 1, 1, 1])
print(s.kurtosis())
# 输出：-3.0

在第一个示例中，计算了一个包含六个数的序列的峰度。结果显示，该序列的峰度值为 -1.47。由于这个值小于 0，因此可以说该序列比正态分布要扁平一些。

在第二个示例中，计算了一个包含五个 1 的序列的峰度。结果显示，该序列的峰度值为 -3，符合预期，因为对于所有值都相等的序列，其峰度值总是 -3。

注意，由于峰度的计算与数据分布的形态有关，因此峰度值并不能直接用于说明数据的分布形态，需要结合其他指标一起使用。