📅  最后修改于: 2023-12-03 15:38:36.256000             🧑  作者: Mango
在数据分析和数据处理中,我们经常需要将时间序列中的年份和日期时间分开进行处理。本文将介绍在Python中如何将年份与日期时间列分开。
假设我们有一个包含日期时间的数据集,我们需要将其分为时间和日期两列。
使用Python中的pandas库来操作数据集。
import pandas as pd
data = {'date_time': ['2021-05-01 12:34:56', '2022-06-02 11:22:33', '2023-07-03 10:11:12'],
'value': [10, 20, 30]}
df = pd.DataFrame(data)
我们创建了一个包含3个日期时间和一个值的数据集。
在对日期时间进行操作之前,必须先将其转换为pandas的datetime格式。
df['date_time'] = pd.to_datetime(df['date_time'])
可以通过.dt.date
和.dt.time
方法将日期和时间进行分离,分别创建日期与时间列。
df['date'] = df['date_time'].dt.date
df['time'] = df['date_time'].dt.time
可以通过.dt.year
方法将年份进行分离,创建年份列。
df['year'] = df['date_time'].dt.year
完整代码如下:
import pandas as pd
# 创建数据集
data = {'date_time': ['2021-05-01 12:34:56', '2022-06-02 11:22:33', '2023-07-03 10:11:12'],
'value': [10, 20, 30]}
df = pd.DataFrame(data)
# 转换为datetime格式
df['date_time'] = pd.to_datetime(df['date_time'])
# 分离日期与时间
df['date'] = df['date_time'].dt.date
df['time'] = df['date_time'].dt.time
# 分离年份
df['year'] = df['date_time'].dt.year
print(df)
输出结果如下:
date_time value date time year
0 2021-05-01 12:34:56 10 2021-05-01 12:34:56 2021
1 2022-06-02 11:22:33 20 2022-06-02 11:22:33 2022
2 2023-07-03 10:11:12 30 2023-07-03 10:11:12 2023
通过以上步骤,我们可以将数据集中的日期时间列分为日期、时间和年份三列。可以根据需要选择相应的列进行数据处理和分析。