📅  最后修改于: 2023-12-03 15:25:53.309000             🧑  作者: Mango
在 pandas 中,我们可以使用 groupby() 函数将数据按照特定的列或列组合进行分组。本文将介绍如何按照两列进行分组。
首先,我们需要导入 pandas 库。我们还将创建一个示例数据集,该数据集包含三列:国家,城市和人口。数据集如下所示:
import pandas as pd
data = {
'country': ['China', 'China', 'USA', 'USA', 'Canada', 'Canada'],
'city': ['Beijing', 'Shanghai', 'New York', 'Los Angeles', 'Toronto', 'Vancouver'],
'population': [20000000, 24000000, 19000000, 15000000, 2600000, 675000]
}
df = pd.DataFrame(data)
接下来,我们将按照国家和城市两列进行分组,并计算每个组的人口总数:
grouped = df.groupby(['country', 'city'])['population'].sum()
print(grouped)
输出结果如下所示:
country city
Canada Toronto 2600000
Vancouver 675000
China Beijing 20000000
Shanghai 24000000
USA Los Angeles 15000000
New York 19000000
Name: population, dtype: int64
这样,我们就成功地按照两列进行了分组,并计算了每个组的人口总数。