📜  Pandas GroupBy – 计算每个组合的出现次数(1)

📅  最后修改于: 2023-12-03 15:33:23.639000             🧑  作者: Mango

Pandas GroupBy – 计算每个组合的出现次数

在数据分析工作中,我们需要对数据进行分组并计算每个组合的出现次数。Pandas中的groupby函数可以很方便地完成这样的任务。

数据准备

我们先导入Pandas并创建一个包含球员姓名和球队名称的数据框:

import pandas as pd

data = {'Player': ['John', 'Mike', 'Steve', 'Peter', 'John', 'Peter'],
        'Team': ['A', 'B', 'A', 'B', 'B', 'A']}
df = pd.DataFrame(data)
print(df)

输出如下:

  Player Team
0   John    A
1   Mike    B
2  Steve    A
3  Peter    B
4   John    B
5  Peter    A
计算每个组合的出现次数

我们可以使用groupbysize函数来计算每个组合的出现次数。

grouped_df = df.groupby(['Player', 'Team']).size().reset_index(name='Count')
print(grouped_df)

这里我们按照PlayerTeam进行分组,并使用size函数计算每个组合的出现次数,最终将结果保存在一个新的数据框中。

输出如下:

  Player Team  Count
0   John    A      1
1   John    B      1
2   Mike    B      1
3  Peter    A      1
4  Peter    B      1
5  Steve    A      1

我们可以看到,结果数据框中包含了每个组合的出现次数。

小结

使用Pandas的groupby函数可以很方便地对数据进行分组并计算每个组合的出现次数。我们可以使用size函数计算出现次数,并使用reset_index函数将结果保存到一个新的数据框中。