📜  带有总计的 pandas ttable - Python (1)

📅  最后修改于: 2023-12-03 15:09:43.892000             🧑  作者: Mango

带有总计的 pandas table - Python

在处理数据时,总计/总和是一项常见的需求。在 Pandas 中,可以轻松地使用 groupby 和 sum 函数来获得总计值。本文将介绍如何创建一个带有总计的 Pandas 表格,并给出一些示例代码。

示例数据

本文使用以下示例数据,其中包含几个城市的销售数据。

| 城市 | 商品 | 销售额 | | ------- | ---- | ------ | | 北京 | A | 100 | | 北京 | B | 200 | | 上海 | A | 300 | | 上海 | B | 400 | | 广州 | A | 500 | | 广州 | B | 600 |

创建带有总计的 Pandas 表格

要创建一个带有总计的 Pandas 表格,我们需要先将数据进行分组处理,然后使用 sum 函数计算总计值。

以下是创建带有总计的 Pandas 表格的示例代码:

import pandas as pd

# 读取示例数据
df = pd.read_csv('sales_data.csv')

# 按城市分组并计算总计值
total_df = df.groupby('城市', as_index=False)['销售额'].sum()
total_df.loc[len(total_df)] = ['总计', None, total_df['销售额'].sum()]

# 输出表格
print(total_df)

输出结果如下所示:

   城市     销售额
0  上海   700.0
1  北京   300.0
2  广州  1100.0
3  总计  2100.0
添加计算其他指标的代码

在实际应用中,我们可能需要计算更多的指标,如平均值、数量等。以下是一个示例代码,计算每个城市的平均销售额和销售数量:

import numpy as np

# 计算平均销售额和销售数量
mean_df = df.groupby('城市', as_index=False)['销售额'].agg([('平均销售额', np.mean), ('销售数量', 'count')])
mean_df.loc[len(mean_df)] = ['总计', mean_df['平均销售额'].mean(), mean_df['销售数量'].sum()]

# 输出表格
print(mean_df)

输出结果如下所示:

   城市      平均销售额  销售数量
0  上海   350.000000      2
1  北京   150.000000      2
2  广州   550.000000      2
3  总计   316.666667      6
结论

本文介绍了如何创建一个带有总计的 Pandas 表格,并给出了一些示例代码。使用 Pandas 轻松创建带有总计的表格,方便查看和分析数据。