📅  最后修改于: 2023-12-03 15:23:14.626000             🧑  作者: Mango
在Pandas中,通常我们需要将一系列的字符串转换为时间序列进行处理和分析。下面介绍几种常用的方法。
Pandas提供了一个to_datetime函数,可以将字符串转换为时间序列。
import pandas as pd
# 创建一个包含日期字符串的DataFrame
df = pd.DataFrame({'date': ['2022-01-01', '2022-01-02', '2022-01-03']})
# 将日期字符串转换为时间序列
df['date'] = pd.to_datetime(df['date'])
print(df)
输出结果:
date
0 2022-01-01
1 2022-01-02
2 2022-01-03
如果你的日期字符串的格式不是标准格式,可以使用format参数指定日期格式。
df = pd.DataFrame({'date': ['2022/01/01', '2022/01/02', '2022/01/03']})
df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')
print(df)
输出结果:
date
0 2022-01-01
1 2022-01-02
2 2022-01-03
如果你的日期字符串包含时间戳,可以使用Unix时间戳(以秒为单位)将其转换为时间序列。可以使用unit参数指定时间戳的单位。
df = pd.DataFrame({'date': ['1641058431', '1641144831', '1641231231']})
df['date'] = pd.to_datetime(df['date'], unit='s')
print(df)
输出结果:
date
0 2022-01-01 11:20:31
1 2022-01-02 11:20:31
2 2022-01-03 11:20:31
如果你的日期字符串包含时区信息,可以使用tz参数处理时区。
df = pd.DataFrame({'date': ['2022-01-01 00:00:00+08:00', '2022-01-02 00:00:00+08:00', '2022-01-03 00:00:00+08:00']})
df['date'] = pd.to_datetime(df['date'], utc=True).dt.tz_convert('Asia/Shanghai')
print(df)
输出结果:
date
0 2022-01-01 00:00:00+08:00
1 2022-01-02 00:00:00+08:00
2 2022-01-03 00:00:00+08:00
以上就是如何在Pandas Dataframe中将一系列日期字符串转换为时间序列的方法。Simplify AI:做AI更简单!