Python|熊猫 dataframe.sum()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas dataframe.sum()
函数返回请求轴的值的总和。如果输入是索引轴,则它将列中的所有值相加,并对所有列重复相同的操作,并返回一个包含每列中所有值之和的序列。它还支持在计算数据帧中的总和时跳过数据帧中的缺失值。
Syntax: DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs)
Parameters :
axis : {index (0), columns (1)}
skipna : Exclude NA/null values when computing the result.
level : If the axis is a MultiIndex (hierarchical), count along a particular level, collapsing into a Series
numeric_only : Include only float, int, boolean columns. If None, will attempt to use everything, then use only numeric data. Not implemented for Series.
min_count : The required number of valid values to perform the operation. If fewer than min_count non-NA values are present the result will be NA.
Returns : sum : Series or DataFrame (if level specified)
有关代码中使用的 CSV 文件的链接,请单击此处
示例 #1:使用sum()
函数查找索引轴上所有值的总和。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
现在找到沿索引轴的所有值的总和。我们将在计算总和时跳过NaN
值。
# finding sum over index axis
# By default the axis is set to 0
df.sum(axis = 0, skipna = True)
输出 :
示例 #2:使用sum()
函数查找列轴上所有值的总和。
现在我们将沿着列轴找到总和。我们将设置skipna为真。如果我们不跳过NaN
值,那么它将导致NaN
值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# sum over the column axis.
df.sum(axis = 1, skipna = True)
输出 :