📅  最后修改于: 2023-12-03 15:18:13.817000             🧑  作者: Mango
Pandas是Python中一个重要的数据处理库,可以对数据进行处理、转换和分析等操作。其中,groupby和mean是Pandas中非常常用的两个函数。
groupby函数的作用是将数据按照一个或多个key进行分组,将同一组数据归为一类。例如:
import pandas as pd
data = {'name': ['张三', '李四', '王五', '麻六', '小明', '小红'],
'gender': ['M', 'M', 'F', 'M', 'M', 'F'],
'score': [80, 85, 75, 90, 95, 70]}
df = pd.DataFrame(data)
grouped = df.groupby('gender')
这里以gender为key进行分组,将数据按照男性和女性两组进行分组。
mean函数的作用是求平均值。可以对DataFrame对象中的列、行、分组后的数据等求平均值。例如:
import pandas as pd
data = {'name': ['张三', '李四', '王五', '麻六', '小明', '小红'],
'gender': ['M', 'M', 'F', 'M', 'M', 'F'],
'score': [80, 85, 75, 90, 95, 70]}
df = pd.DataFrame(data)
grouped = df.groupby('gender')
mean_score = grouped.mean()
这里将数据按照gender进行分组后,求各个分组的score平均值。
import pandas as pd
data = {'name': ['张三', '李四', '王五', '麻六', '小明', '小红'],
'gender': ['M', 'M', 'F', 'M', 'M', 'F'],
'score': [80, 85, 75, 90, 95, 70]}
df = pd.DataFrame(data)
grouped = df.groupby('gender')
mean_score = grouped.mean()
print(mean_score)
输出结果:
score
gender
F 72.500000
M 87.5
参考文献: