📜  将出生日期列转换为年龄熊猫 - Python (1)

📅  最后修改于: 2023-12-03 15:39:15.008000             🧑  作者: Mango

将出生日期列转换为年龄熊猫 - Python

如果你的数据集有出生日期的列,而你更想要的是年龄,那么使用 Python 中的 Pandas 库将会帮助你快速地实现这个目标。

步骤
1. 导入 Pandas 库
import pandas as pd
2. 加载数据集

使用 Pandas 库中的 read_csv() 函数来加载 CSV 文件。本例中,数据集的文件名为 dataset.csv

df = pd.read_csv('dataset.csv')
3. 将出生日期列转换为时间戳

使用 Pandas 库中的 to_datetime() 函数将出生日期转换为 Pandas 库中时间戳的格式。

df['出生日期'] = pd.to_datetime(df['出生日期'])
4. 计算年龄

使用 Pandas 库中的 apply() 函数将每个日期转换为年龄。

df['年龄'] = df['出生日期'].apply(lambda x: (pd.datetime.now().year - x.year))
5. 查看转换后的数据集

使用 Pandas 库中的 head() 函数查看前五行数据。

print(df.head())
完整代码
import pandas as pd

df = pd.read_csv('dataset.csv')

df['出生日期'] = pd.to_datetime(df['出生日期'])

df['年龄'] = df['出生日期'].apply(lambda x: (pd.datetime.now().year - x.year))

print(df.head())
结论

使用 Pandas 库将出生日期列转换为年龄很容易。只需几行代码就可以完成,并且转换后的数据集可以很容易地在 Python 中使用。