📅  最后修改于: 2023-12-03 14:53:51.197000             🧑  作者: Mango
在数据处理中,经常会遇到需要将数字列转换为日期时间的需求。pandas是一个非常强大的数据处理工具,支持将列转换为日期时间类型,并支持多种格式。
import pandas as pd
# 创建示例数据
data = {'date': [20210101, 20210202, 20210303], 'time': [120000, 123000, 124500]}
df = pd.DataFrame(data)
# 将日期和时间列合并为一个字符串列
df['datetime'] = df['date'].astype(str) + df['time'].astype(str)
# 将字符串列转换为日期时间类型
df['datetime'] = pd.to_datetime(df['datetime'], format='%Y%m%d%H%M%S')
# 打印结果
print(df)
输出结果:
date time datetime
0 20210101 120000 2021-01-01 12:00:00
1 20210202 123000 2021-02-02 12:30:00
2 20210303 124500 2021-03-03 12:45:00
首先,我们创建了一个包含日期和时间列的示例数据。
然后,我们将日期和时间列合并为一个字符串列,方便转换为日期时间类型。这里我们使用了astype()
方法将整数转换为字符串,并使用了字符串拼接功能。
接着,我们使用to_datetime()
方法将字符串列转换为日期时间类型。这里需要指定format
参数来告诉pandas如何解析字符串。format
参数的具体格式可以参考pandas官方文档。
最后,我们打印结果。可以看到,日期和时间列已经被合并成了一个日期时间列,并且格式正确。
通过本文,你学会了如何将数字列转换为日期时间,以及如何使用pandas处理日期时间类型的数据。pandas支持多种日期时间格式,可以轻松满足不同场景下的数据处理需求。