📅  最后修改于: 2020-10-29 01:47:04             🧑  作者: Mango
DataFrame.aggregate()函数的主要任务是将聚合应用于一个或多个列。最常用的聚合是:
sum:用于返回所请求轴的值之和。
min:用于返回所请求轴的最小值。
max:用于返回所请求轴的最大值。
DataFrame.aggregate(func, axis=0, *args, **kwargs)
func:表示可调用,字符串,字典或字符串/可调用列表。
它用于汇总数据。对于函数,传递给DataFrame或DataFrame.apply()时,它必须可以工作。对于DataFrame,如果键是列名,则可以传递dict。
axis
:(默认为0):表示0或“索引”,1或“列”
0或“索引”:这是每列的应用函数。
1或“列”:这是每行的应用函数。
* args:这是一个位置参数,将传递给func。
** kwargs:这是一个关键字参数,将传递给函数。
它返回标量,Series或DataFrame。
标量:使用单个函数调用Series.agg时使用。
系列:在为单个函数调用DataFrame.agg时使用。
DataFrame:为多个函数调用DataFrame.agg时使用。
import pandas as pd
import numpy as np
info=pd.DataFrame([[1,5,7],[10,12,15],[18,21,24],[np.nan,np.nan,np.nan]],columns=['X','Y','Z'])
info.agg(['sum','min'])
输出:
X Y Z
sum 29.0 38.0 46.0
min 1.0 5.0 7.0
import pandas as pd
import numpy as np
info=pd.DataFrame([[1,5,7],[10,12,15],[18,21,24],[np.nan,np.nan,np.nan]],columns=['X','Y','Z'])
df.agg({'A' : ['sum', 'min'], 'B' : ['min', 'max']})
输出:
X Y
max NaN 21.0
min 1.0 12.0
sum 29.0 NaN