📜  Python|熊猫 dataframe.median()(1)

📅  最后修改于: 2023-12-03 15:04:26.737000             🧑  作者: Mango

Python | 熊猫 dataframe.median()

介绍

在 Python 中,熊猫(Pandas)库是一个流行的数据处理库,而 dataframe 是熊猫中的重要数据结构。dataframe.median() 是一个用于计算数据帧(dataframe)列的中位数的方法。中位数是将一组数据按升序排列后,位于中间位置的值。

语法

以下是 dataframe.median() 的语法:

dataframe.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
参数
  • axis:指定计算中位数的轴或维度。默认为 None,表示计算每列的中位数。
  • skipna:指定是否跳过 NaN 值。默认为 None,表示不跳过 NaN 值。
  • level:多层索引时,指定计算中位数的索引级别。默认为 None,表示计算所有索引级别的中位数。
  • numeric_only:指定是否仅计算数值类型(整数、浮点数)的列的中位数。默认为 None,表示计算所有列的中位数。
返回值

dataframe.median() 方法返回一个包含计算的中位数的 SeriesDataFrame

示例

假设有一个数据帧 df,包含以下数据:

| A | B | C | | --- | --- | --- | | 1 | 2 | 3 | | 4 | 5 | 6 | | 7 | 8 | 9 |

通过调用 df.median() 方法,可以计算出每列的中位数。

代码示例:

import pandas as pd

data = {'A': [1, 4, 7], 'B': [2, 5, 8], 'C': [3, 6, 9]}
df = pd.DataFrame(data)

median_values = df.median()

print(median_values)

输出结果:

A    4.0
B    5.0
C    6.0
dtype: float64
注意事项
  • 默认情况下,skipna 参数为 None,计算中位数时不跳过 NaN 值。如果想跳过 NaN 值,可以将其设置为 True
  • 熊猫库中的 dataframe.median() 方法也可以直接应用于 Series
  • 如果数据中包含字符串等非数值类型的列,默认情况下会返回 NaN 值作为中位数。
  • 如果 dataframe 中的所有列都是数值类型,可以使用 numeric_only=True 参数只计算数值类型列的中位数。

以上就是关于 Python | 熊猫 dataframe.median() 方法的介绍。使用这个方法可以方便地计算数据帧列的中位数,进一步处理和分析数据。