📅  最后修改于: 2023-12-03 15:07:06.298000             🧑  作者: Mango
Pandas 是一个广泛使用的数据处理库,它为数据分析提供了一系列强大的工具和功能。本文将介绍如何为 Pandas 数据框添加一个新列,该列包含根据出生日期和当前日期计算的年龄间隔。
我们希望在一个名为 df
的 Pandas 数据框中添加一个名为 age
的新列,该列包含一个整数值,表示每个行对应的人的年龄。
我们将解决这个问题,分为以下几个步骤:
import pandas as pd
# 按照 Pandas 读取数据
df = pd.read_csv('data.csv')
# 将日期列转换为 Pandas 日期类型
df['birth_date'] = pd.to_datetime(df['birth_date'])
# 计算当前日期
current_date = pd.to_datetime('today')
# 计算年龄间隔
df['age'] = (current_date - df['birth_date']).astype('<m8[Y]')
print(df.head())
输出结果:
first_name last_name birth_date age
0 Jason Sanders 11/8/2003 17.0
1 Cameron Rodriguez 2/13/1992 29.0
2 Madison Martinez 6/13/1971 50.0
3 Jeremy Wood 2/10/1982 39.0
4 Laura Lee 1/1/1990 31.0
这个结果可以很好地工作,并且它可以轻松地扩展以涉及更复杂的统计量或组合。
在本文中,我们介绍了如何添加一个具有年龄间隔的新列到 Pandas 数据框中。如果您遇到了类似的问题,我们希望我们的解决方案能够解决您的困境!