📅  最后修改于: 2023-12-03 14:45:02.245000             🧑  作者: Mango
在 Pandas 中,我们可以使用 boolean array 根据另一个列过滤数据,并计算特定列的平均值。
具体来说,我们可以使用 Pandas 的 loc
方法选择符合条件的记录,然后使用 mean
方法计算特定列的平均值。
下面是一个示例程序,演示了如何使用 boolean array 根据 'gender' 列过滤数据,并计算 'score' 列的平均值:
import pandas as pd
# 读取数据
data = pd.read_csv('students.csv')
# 根据 gender 列过滤数据
male = data.loc[data['gender'] == 'M']
female = data.loc[data['gender'] == 'F']
# 计算 score 列的平均值
male_avg_score = male['score'].mean()
female_avg_score = female['score'].mean()
# 输出结果
print('Male average score:', male_avg_score)
print('Female average score:', female_avg_score)
这个程序会读取一个名为 'students.csv' 的 CSV 文件,该文件包含了学生的性别、成绩、年龄等信息。然后,程序会根据 'gender' 列过滤数据,并计算 'score' 列的平均值,并输出结果。
这个程序可以通过修改 'students.csv' 文件中的数据来适用于不同的数据集。同时,也可以根据不同的列来过滤数据,计算不同列的平均值,以满足不同的需求。
以上就是关于使用 Pandas boolean array 根据另一个列过滤器计算列的平均值的介绍,希望对大家有所帮助。