📅  最后修改于: 2023-12-03 15:26:42.656000             🧑  作者: Mango
Pandas 是一个广泛使用的 Python 数据分析库。其中一个常见的数据类型是 DataFrame,它可以读取不同格式的数据,包括 CSV、Excel、SQL 和 JSON 等。很多数据集都包括日期字段,本文将介绍如何在 Pandas 中格式化日期字段。
在 Pandas 的 DataFrame 中,日期可以表示成 Python datetime 对象、字符串或 Timestamp 对象。首先,我们需要将日期字段转换成 datetime 类型。
import pandas as pd
# 示例数据
data = {'date': ['2020-01-01', '2020-01-02', '2020-01-03'],
'value': [1, 2, 3]}
# 创建 DataFrame
df = pd.DataFrame(data)
# 将日期字段转换成 datetime 类型
df['date'] = pd.to_datetime(df['date'])
# 输出 DataFrame
print(df)
输出结果:
date value
0 2020-01-01 1
1 2020-01-02 2
2 2020-01-03 3
一旦日期字段被转换成 datetime 类型,我们可以使用 strftime 方法来格式化日期。
以下是一些常见的日期格式化选项:
| 格式代码 | 说明 | | ---- | ---- | | %Y | 年(四位数) | | %y | 年(两位数) | | %m | 月(01-12) | | %d | 日(01-31) | | %H | 时(00-23) | | %I | 时(00-12) | | %M | 分(00-59) | | %S | 秒(00-59) |
我们来看一个示例,将日期字段格式化成 'YYYY年MM月DD日 HH时MM分SS秒' 形式:
# 格式化日期字段
df['formatted_date'] = df['date'].apply(lambda x: x.strftime('%Y年%m月%d日 %H时%M分%S秒'))
# 输出 DataFrame
print(df)
输出结果:
date value formatted_date
0 2020-01-01 1 2020年01月01日 00时00分00秒
1 2020-01-02 2 2020年01月02日 00时00分00秒
2 2020-01-03 3 2020年01月03日 00时00分00秒