📅  最后修改于: 2023-12-03 15:10:09.190000             🧑  作者: Mango
在Pandas中,我们经常需要对数据进行聚合和分组。其中一个常见的任务是按照某些列进行分组,并计算每个组的总和。此外,我们可能需要创建新列以保存所计算出的总和。
下面是一个简单的Python代码示例,演示如何使用Pandas按照“熊猫”这一列进行分组,并计算每个组的总和。然后,我们将结果保存在一个新的列中。
import pandas as pd
# 创建示例数据帧
df = pd.DataFrame({
"动物": ["熊猫", "熊猫", "熊猫", "虎", "虎", "狮子", "狮子"],
"数量": [1, 2, 3, 4, 5, 6, 7]
})
# 按照“动物”列分组,并计算每个组的总和
grouped_df = df.groupby("动物").sum()
# 创建新列来保存计算出的总和
grouped_df["总数"] = grouped_df["数量"]
# 打印结果
print(grouped_df)
代码输出:
数量 总数
动物
熊猫 6 6
狮子 13 13
虎 9 9
上述代码中,我们首先创建了一个示例数据帧,其中包含了“动物”和“数量”两列。然后,我们按照“动物”列进行分组,并计算每个组的总和,结果保存在一个名为“grouped_df”的新数据帧中。
接着,我们创建了一个名为“总数”的新列,它的值与“数量”列相同,即总和。
最后,我们打印出整个新的数据帧,它包含了原始数据和计算出的总和列。
此示例代码演示了如何使用Pandas快速、轻松地按照指定列进行分组,并计算每个组的总和,同时创建新列,以保存所计算的总和。