📅  最后修改于: 2020-10-29 02:19:21             🧑  作者: Mango
Pandas DataFrame.sum()函数用于返回用户所请求轴的值之和。如果输入值是索引轴,则它将在列中添加所有值,并且对所有列都相同。它返回一个包含每个列中所有值之和的序列。
在计算DataFrame中的总和时,它还能够跳过DataFrame中的缺失值。
DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs)
axis
: {索引(0),列(1)}0或’index’用于行,而1或’columns’用于列。
它用于排除所有空值。
level
:整数或级别名称,默认为无如果轴是多索引,则它沿特定级别计数并折叠为一个系列。
它仅包含int,float和boolean列。如果为None,它将尝试使用所有内容,因此应使用数字数据。
它是指执行任何操作所需的有效值数量。如果小于min_count,则显示非NA值,则结果为NaN。
如果指定级别,则返回Series或DataFrame的总和。
import pandas as pd
# default min_count = 0
pd.Series([]).sum()
# Passed min_count = 1, then sum of an empty series will be NaN
pd.Series([]).sum(min_count = 1)
输出量
0.0
nan
import pandas as pd
# making a dict of list
info = {'Name': ['Parker', 'Smith', 'William'],
'age' : [32, 28, 39]}
data = pd.DataFrame(info)
# sum of all salary stored in 'total'
data['total'] = data['age'].sum()
print(data)
输出量
Name age total
0 Parker 32 99
1 Smith 28 99
2 William 39 99