📅  最后修改于: 2023-12-03 15:33:23.861000             🧑  作者: Mango
Pandas sum groupby是一个功能强大的方法,可以对一个数据集进行聚合分析。比较常见的应用场景是对数据集中的某一列进行分组(groupby),然后求出每个组内的另一列数据的和(sum)。
接下来,我们将使用一个示例数据集,其中包含了一些销售数据,来说明如何使用pandas sum groupby进行聚合分析。
import pandas as pd
sales_data = {'year': [2010, 2010, 2011, 2011, 2012, 2012, 2013, 2013],
'region': ['North', 'South', 'North', 'South', 'North', 'South', 'North', 'South'],
'product': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
'sales': [100, 200, 300, 400, 500, 600, 700, 800]}
df = pd.DataFrame(sales_data)
现在,我们有了一个名为df的DataFrame,我们可以使用pandas sum groupby方法对其进行分组聚合分析。
grouped = df.groupby('year')['sales'].sum()
print(grouped)
输出结果:
year
2010 300
2011 700
2012 1100
2013 1500
Name: sales, dtype: int64
通过上述代码,我们可以看到,我们首先使用了groupby方法按照'year'这一列进行了分组,然后对'sales'这一列进行了求和操作,并得到了每一年的销售总额。
使用pandas sum groupby可以很方便地对数据集进行聚合分析,求出每一组(group)内某一列数据的和(sum)。通过这种方法,我们可以更好地了解数据集的特征和分布。