📅  最后修改于: 2023-12-03 14:56:07.631000             🧑  作者: Mango
在数据分析中,经常需要将年龄转换为不同的年龄组别,以便于分析和可视化。本文介绍如何使用Python中的pandas库将年龄转换为年龄类别,并将其添加到数据框中。
安装好Python和pandas库,并准备好包含年龄的数据框。在本文中,我们将使用名为df
的数据框。
import pandas as pd
# 创建示例数据框
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
'年龄': [21, 33, 45, 28, 50]}
df = pd.DataFrame(data)
# 将年龄转换为年龄类别,0-30岁为“青年”,31-50岁为“中年”,51岁及以上为“老年”
bins = [0, 30, 50, 120]
labels = ['青年', '中年', '老年']
df['年龄类别'] = pd.cut(df['年龄'], bins=bins, labels=labels)
上述代码使用pd.cut()
函数将df
数据框中的年龄列转换为三个年龄类别:青年、中年和老年。我们将0-30岁设为“青年”类别、31-50岁设为“中年”类别,51岁及以上设为“老年”类别。
print(df)
姓名 年龄 年龄类别
0 张三 21 青年
1 李四 33 中年
2 王五 45 中年
3 赵六 28 青年
4 钱七 50 中年
输出结果显示成功将年龄转换为了年龄类别列。
本文向您介绍了如何使用Python中的pandas库将年龄转换为年龄类别,并将其添加到数据框中。我们使用了pd.cut()
函数将年龄转换为青年、中年和老年三个类别。