📜  添加年龄类别 pandas 数据框 - Python (1)

📅  最后修改于: 2023-12-03 14:56:07.631000             🧑  作者: Mango

添加年龄类别 pandas 数据框 - Python

在数据分析中,经常需要将年龄转换为不同的年龄组别,以便于分析和可视化。本文介绍如何使用Python中的pandas库将年龄转换为年龄类别,并将其添加到数据框中。

准备工作

安装好Python和pandas库,并准备好包含年龄的数据框。在本文中,我们将使用名为df的数据框。

import pandas as pd

# 创建示例数据框
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
        '年龄': [21, 33, 45, 28, 50]}
df = pd.DataFrame(data)
添加年龄类别列
# 将年龄转换为年龄类别,0-30岁为“青年”,31-50岁为“中年”,51岁及以上为“老年”
bins = [0, 30, 50, 120]
labels = ['青年', '中年', '老年']
df['年龄类别'] = pd.cut(df['年龄'], bins=bins, labels=labels)

上述代码使用pd.cut()函数将df数据框中的年龄列转换为三个年龄类别:青年、中年和老年。我们将0-30岁设为“青年”类别、31-50岁设为“中年”类别,51岁及以上设为“老年”类别。

print(df)
姓名  年龄 年龄类别
0  张三  21   青年
1  李四  33   中年
2  王五  45   中年
3  赵六  28   青年
4  钱七  50   中年

输出结果显示成功将年龄转换为了年龄类别列。

总结

本文向您介绍了如何使用Python中的pandas库将年龄转换为年龄类别,并将其添加到数据框中。我们使用了pd.cut()函数将年龄转换为青年、中年和老年三个类别。