📅  最后修改于: 2023-12-03 15:04:26.737000             🧑  作者: Mango
在 Python 中,熊猫(Pandas)库是一个流行的数据处理库,而 dataframe
是熊猫中的重要数据结构。dataframe.median()
是一个用于计算数据帧(dataframe)列的中位数的方法。中位数是将一组数据按升序排列后,位于中间位置的值。
以下是 dataframe.median()
的语法:
dataframe.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
axis
:指定计算中位数的轴或维度。默认为 None
,表示计算每列的中位数。skipna
:指定是否跳过 NaN 值。默认为 None
,表示不跳过 NaN 值。level
:多层索引时,指定计算中位数的索引级别。默认为 None
,表示计算所有索引级别的中位数。numeric_only
:指定是否仅计算数值类型(整数、浮点数)的列的中位数。默认为 None
,表示计算所有列的中位数。dataframe.median()
方法返回一个包含计算的中位数的 Series
或 DataFrame
。
假设有一个数据帧 df
,包含以下数据:
| A | B | C | | --- | --- | --- | | 1 | 2 | 3 | | 4 | 5 | 6 | | 7 | 8 | 9 |
通过调用 df.median()
方法,可以计算出每列的中位数。
代码示例:
import pandas as pd
data = {'A': [1, 4, 7], 'B': [2, 5, 8], 'C': [3, 6, 9]}
df = pd.DataFrame(data)
median_values = df.median()
print(median_values)
输出结果:
A 4.0
B 5.0
C 6.0
dtype: float64
skipna
参数为 None
,计算中位数时不跳过 NaN 值。如果想跳过 NaN 值,可以将其设置为 True
。dataframe.median()
方法也可以直接应用于 Series
。dataframe
中的所有列都是数值类型,可以使用 numeric_only=True
参数只计算数值类型列的中位数。以上就是关于 Python | 熊猫 dataframe.median()
方法的介绍。使用这个方法可以方便地计算数据帧列的中位数,进一步处理和分析数据。