📜  格式化 pandas 中的日期字段 - Python (1)

📅  最后修改于: 2023-12-03 15:26:42.656000             🧑  作者: Mango

格式化 pandas 中的日期字段 - Python

Pandas 是一个广泛使用的 Python 数据分析库。其中一个常见的数据类型是 DataFrame,它可以读取不同格式的数据,包括 CSV、Excel、SQL 和 JSON 等。很多数据集都包括日期字段,本文将介绍如何在 Pandas 中格式化日期字段。

在 Pandas 的 DataFrame 中,日期可以表示成 Python datetime 对象、字符串或 Timestamp 对象。首先,我们需要将日期字段转换成 datetime 类型。

将日期字段转换成 datetime 类型
import pandas as pd

# 示例数据
data = {'date': ['2020-01-01', '2020-01-02', '2020-01-03'],
        'value': [1, 2, 3]}

# 创建 DataFrame
df = pd.DataFrame(data)

# 将日期字段转换成 datetime 类型
df['date'] = pd.to_datetime(df['date'])

# 输出 DataFrame
print(df)

输出结果:

        date  value
0 2020-01-01      1
1 2020-01-02      2
2 2020-01-03      3
格式化日期字段

一旦日期字段被转换成 datetime 类型,我们可以使用 strftime 方法来格式化日期。

以下是一些常见的日期格式化选项:

| 格式代码 | 说明 | | ---- | ---- | | %Y | 年(四位数) | | %y | 年(两位数) | | %m | 月(01-12) | | %d | 日(01-31) | | %H | 时(00-23) | | %I | 时(00-12) | | %M | 分(00-59) | | %S | 秒(00-59) |

我们来看一个示例,将日期字段格式化成 'YYYY年MM月DD日 HH时MM分SS秒' 形式:

# 格式化日期字段
df['formatted_date'] = df['date'].apply(lambda x: x.strftime('%Y年%m月%d日 %H时%M分%S秒'))

# 输出 DataFrame
print(df)

输出结果:

        date  value      formatted_date
0 2020-01-01      1  2020年01月01日 00时00分00秒
1 2020-01-02      2  2020年01月02日 00时00分00秒
2 2020-01-03      3  2020年01月03日 00时00分00秒
参考文献