📜  Python|熊猫 dataframe.quantile()(1)

📅  最后修改于: 2023-12-03 15:34:20.233000             🧑  作者: Mango

Python | 熊猫 dataframe.quantile()

介绍

dataframe.quantile(q=0.5, axis=0, numeric_only=True, interpolation='linear')是熊猫(Pandas)库中的一种函数,用于计算数据帧(DataFrame)中的百分位数。

参数
  • q:百分位数,可以是单一值或由多个值组成的数组。
  • axis:计算的轴。默认值为0,表示按列计算。
  • numeric_only:bool值,指定是否仅计算数字列。默认为True。
  • interpolation:指定内插法,可选值包括'linear', 'lower', 'higher', 'midpoint' 和 'nearest'。默认为'linear'。
返回值

返回数据帧(DataFrame)或数据系列(Series)中给定百分位数的值。

示例
import pandas as pd

# 创建数据帧
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

# 计算中位数,即50%分位数
median = df.quantile(q=0.5)
print(median)

输出结果:

A    2.0
B    5.0
C    8.0
Name: 0.5, dtype: float64
import pandas as pd

# 创建数据帧
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

# 计算25%、50%、75%分位数
quantile = df.quantile(q=[0.25,0.5,0.75])
print(quantile)

输出结果:

        A    B    C
0.25  1.25  4.5  7.5
0.50  2.00  5.0  8.0
0.75  2.75  5.5  8.5
注意事项

如果数据帧(DataFrame)中包含非数字列,numeric_only参数必须设置为False,否则该列将被跳过,不进行计算。

不同的内插法对于计算结果可能会产生不同的影响,在使用时需注意。