📅  最后修改于: 2023-12-03 15:09:43.892000             🧑  作者: Mango
在处理数据时,总计/总和是一项常见的需求。在 Pandas 中,可以轻松地使用 groupby 和 sum 函数来获得总计值。本文将介绍如何创建一个带有总计的 Pandas 表格,并给出一些示例代码。
本文使用以下示例数据,其中包含几个城市的销售数据。
| 城市 | 商品 | 销售额 | | ------- | ---- | ------ | | 北京 | A | 100 | | 北京 | B | 200 | | 上海 | A | 300 | | 上海 | B | 400 | | 广州 | A | 500 | | 广州 | B | 600 |
要创建一个带有总计的 Pandas 表格,我们需要先将数据进行分组处理,然后使用 sum 函数计算总计值。
以下是创建带有总计的 Pandas 表格的示例代码:
import pandas as pd
# 读取示例数据
df = pd.read_csv('sales_data.csv')
# 按城市分组并计算总计值
total_df = df.groupby('城市', as_index=False)['销售额'].sum()
total_df.loc[len(total_df)] = ['总计', None, total_df['销售额'].sum()]
# 输出表格
print(total_df)
输出结果如下所示:
城市 销售额
0 上海 700.0
1 北京 300.0
2 广州 1100.0
3 总计 2100.0
在实际应用中,我们可能需要计算更多的指标,如平均值、数量等。以下是一个示例代码,计算每个城市的平均销售额和销售数量:
import numpy as np
# 计算平均销售额和销售数量
mean_df = df.groupby('城市', as_index=False)['销售额'].agg([('平均销售额', np.mean), ('销售数量', 'count')])
mean_df.loc[len(mean_df)] = ['总计', mean_df['平均销售额'].mean(), mean_df['销售数量'].sum()]
# 输出表格
print(mean_df)
输出结果如下所示:
城市 平均销售额 销售数量
0 上海 350.000000 2
1 北京 150.000000 2
2 广州 550.000000 2
3 总计 316.666667 6
本文介绍了如何创建一个带有总计的 Pandas 表格,并给出了一些示例代码。使用 Pandas 轻松创建带有总计的表格,方便查看和分析数据。