📜  Python|熊猫 dataframe.mad()(1)

📅  最后修改于: 2023-12-03 15:04:26.709000             🧑  作者: Mango

Python Pandas DataFrame.mad()

DataFrame.mad() 是 Pandas 库中的 DataFrame 类的一个函数。它用于计算 DataFrame 中每列的绝对平均偏差(Mean Absolute Deviation, MAD)。

语法
DataFrame.mad(axis=None, skipna=None, level=None, numeric_only=None)

其中,参数的含义如下:

  • axis:指定计算的轴向,axis=0 代表按列计算,axis=1 代表按行计算,默认值为 None,表示计算整个 DataFrame 的 MAD。
  • skipna:是否跳过 NA/NaN 值的计算,默认为 True。
  • level:如果 DataFrame 是层次化的(具有多层索引),则指定要计算的索引级别。
  • numeric_only:是否仅计算数值型数据,默认为 True。
返回结果

该函数返回一个 Series,其中包含每个列的 MAD。

示例

假设我们有以下 DataFrame:

import pandas as pd

data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)

我们可以通过以下方式计算每列的 MAD:

mad = df.mad()
print(mad)

输出结果为:

A    1.2
B    1.2
C    1.2
dtype: float64

在上述示例中,不同列的 MAD 结果都是 1.2。

应用场景

DataFrame.mad() 函数适用于以下情况:

  1. 计算数据集每列的平均绝对偏差,用于评估数据的分布情况。
  2. 通过计算 MAD,我们可以检查数据是否具有较大的离群值或异常值。

这个函数对于数据分析和统计任务非常有用,特别是在数据清洗和异常值检测方面。

参考资料