📅  最后修改于: 2023-12-03 15:06:49.471000             🧑  作者: Mango
Pandas是一个强大的数据分析库,其中Group by模块允许我们对数据进行分组和聚合操作。在本文中,我们将介绍如何使用Pandas Group by模块创建非分层列。
首先,我们创建一个示例数据集:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Ella', 'Frank'],
'age': [25, 30, 20, 35, 40, 27],
'gender': ['F', 'M', 'M', 'M', 'F', 'M'],
'score': [75, 80, 60, 90, 95, 70]}
df = pd.DataFrame(data)
我们的数据集包括四个字段:姓名(name)、年龄(age)、性别(gender)和分数(score)。现在我们将使用Group by模块对它进行分组和聚合。
首先,我们定义要聚合的列。然后,我们使用Group by模块对数据进行分组,并对每个组进行聚合操作。
# 定义要聚合的列
group_cols = ['gender', 'age']
# 使用Group by模块对数据进行分组和聚合
result = df.groupby(group_cols, as_index=False).mean()
在上面的代码中,我们定义了两个要分组和聚合的列:性别(gender)和年龄(age)。我们指定了参数as_index=False以避免出现分层列。最后,我们使用mean()函数对分数(score)列进行求平均值的操作。
让我们输出结果并查看数据集:
print(result)
输出:
gender age score
0 F 25 75
1 F 40 95
2 M 20 60
3 M 27 70
4 M 30 80
5 M 35 90
输出结果显示,我们成功地对数据集进行了分组和聚合操作,并且没有出现分层列。
在本文中,我们介绍了如何使用Pandas Group by模块创建非分层列。通过使用Group by模块,我们可以轻松地对数据进行分组和聚合操作,以实现我们的数据分析和挖掘目标。