📜  按 2 列 pandas 分组 - Python (1)

📅  最后修改于: 2023-12-03 15:25:53.309000             🧑  作者: Mango

按 2 列 pandas 分组 - Python

在 pandas 中,我们可以使用 groupby() 函数将数据按照特定的列或列组合进行分组。本文将介绍如何按照两列进行分组。

准备工作

首先,我们需要导入 pandas 库。我们还将创建一个示例数据集,该数据集包含三列:国家,城市和人口。数据集如下所示:

import pandas as pd

data = {
    'country': ['China', 'China', 'USA', 'USA', 'Canada', 'Canada'],
    'city': ['Beijing', 'Shanghai', 'New York', 'Los Angeles', 'Toronto', 'Vancouver'],
    'population': [20000000, 24000000, 19000000, 15000000, 2600000, 675000]
}

df = pd.DataFrame(data)
按两列分组

接下来,我们将按照国家和城市两列进行分组,并计算每个组的人口总数:

grouped = df.groupby(['country', 'city'])['population'].sum()
print(grouped)

输出结果如下所示:

country  city       
Canada   Toronto        2600000
         Vancouver       675000
China    Beijing       20000000
         Shanghai      24000000
USA      Los Angeles   15000000
         New York      19000000
Name: population, dtype: int64

这样,我们就成功地按照两列进行了分组,并计算了每个组的人口总数。