📅  最后修改于: 2023-12-03 15:39:15.008000             🧑  作者: Mango
如果你的数据集有出生日期的列,而你更想要的是年龄,那么使用 Python 中的 Pandas 库将会帮助你快速地实现这个目标。
import pandas as pd
使用 Pandas 库中的 read_csv()
函数来加载 CSV 文件。本例中,数据集的文件名为 dataset.csv
。
df = pd.read_csv('dataset.csv')
使用 Pandas 库中的 to_datetime()
函数将出生日期转换为 Pandas 库中时间戳的格式。
df['出生日期'] = pd.to_datetime(df['出生日期'])
使用 Pandas 库中的 apply()
函数将每个日期转换为年龄。
df['年龄'] = df['出生日期'].apply(lambda x: (pd.datetime.now().year - x.year))
使用 Pandas 库中的 head()
函数查看前五行数据。
print(df.head())
import pandas as pd
df = pd.read_csv('dataset.csv')
df['出生日期'] = pd.to_datetime(df['出生日期'])
df['年龄'] = df['出生日期'].apply(lambda x: (pd.datetime.now().year - x.year))
print(df.head())
使用 Pandas 库将出生日期列转换为年龄很容易。只需几行代码就可以完成,并且转换后的数据集可以很容易地在 Python 中使用。