按 2 列 pandas 分组 - Python (1)

📌 相关文章

📜 按 2 列 pandas 分组 - Python (1)

📅 最后修改于: 2023-12-03 15:25:53.309000 🧑 作者: Mango

按 2 列 pandas 分组 - Python

在 pandas 中，我们可以使用 groupby() 函数将数据按照特定的列或列组合进行分组。本文将介绍如何按照两列进行分组。

准备工作

首先，我们需要导入 pandas 库。我们还将创建一个示例数据集，该数据集包含三列：国家，城市和人口。数据集如下所示：

import pandas as pd

data = {
    'country': ['China', 'China', 'USA', 'USA', 'Canada', 'Canada'],
    'city': ['Beijing', 'Shanghai', 'New York', 'Los Angeles', 'Toronto', 'Vancouver'],
    'population': [20000000, 24000000, 19000000, 15000000, 2600000, 675000]
}

df = pd.DataFrame(data)

按两列分组

接下来，我们将按照国家和城市两列进行分组，并计算每个组的人口总数：

grouped = df.groupby(['country', 'city'])['population'].sum()
print(grouped)

输出结果如下所示：

country  city       
Canada   Toronto        2600000
         Vancouver       675000
China    Beijing       20000000
         Shanghai      24000000
USA      Los Angeles   15000000
         New York      19000000
Name: population, dtype: int64

这样，我们就成功地按照两列进行了分组，并计算了每个组的人口总数。