📜  Pandas DataFrame.aggregate()

📅  最后修改于: 2020-10-29 01:47:04             🧑  作者: Mango

Pandas DataFrame.aggregate()

DataFrame.aggregate()函数的主要任务是将聚合应用于一个或多个列。最常用的聚合是:

sum:用于返回所请求轴的值之和。

min:用于返回所请求轴的最小值。

max:用于返回所请求轴的最大值。

句法:

DataFrame.aggregate(func, axis=0, *args, **kwargs)

参数:

func:表示可调用,字符串,字典或字符串/可调用列表。

它用于汇总数据。对于函数,传递给DataFrame或DataFrame.apply()时,它必须可以工作。对于DataFrame,如果键是列名,则可以传递dict。

axis:(默认为0):表示0或“索引”,1或“列”

0或“索引”:这是每列的应用函数。

1或“列”:这是每行的应用函数。

* args:这是一个位置参数,将传递给func。

** kwargs:这是一个关键字参数,将传递给函数。

返回值:

它返回标量,Series或DataFrame。

标量:使用单个函数调用Series.agg时使用。

系列:在为单个函数调用DataFrame.agg时使用。

DataFrame:为多个函数调用DataFrame.agg时使用。

例:

import pandas as pd
import numpy as np
info=pd.DataFrame([[1,5,7],[10,12,15],[18,21,24],[np.nan,np.nan,np.nan]],columns=['X','Y','Z'])
info.agg(['sum','min'])

输出:

X     Y     Z
sum  29.0  38.0  46.0
min   1.0   5.0   7.0

范例2:

import pandas as pd
import numpy as np
info=pd.DataFrame([[1,5,7],[10,12,15],[18,21,24],[np.nan,np.nan,np.nan]],columns=['X','Y','Z'])
df.agg({'A' : ['sum', 'min'], 'B' : ['min', 'max']})

输出:

      X       Y  
max   NaN  21.0
min   1.0  12.0
sum  29.0  NaN