📜  datafram 将 3 列组合到日期时间 - Python (1)

📅  最后修改于: 2023-12-03 15:00:20.920000             🧑  作者: Mango

DataFrame 将 3 列组合到日期时间 - Python

在 Python 中,使用 pandas 库中的 DataFrame 可以很方便地对数据进行处理和分析。其中一个常见的操作就是将多个列组合成一个日期时间列,本文将介绍如何使用 DataFrame 在 Python 中实现这一操作。

1. 进行数据导入

首先,需要导入 pandas 库,并读取数据文件。这里假设数据文件为 csv 格式,包含三列数据:年、月、日。

import pandas as pd

data = pd.read_csv('data.csv')
2. 将三列数据组合成一个日期时间列

接下来,需要将年、月、日三列数据组合成一个日期时间列。这可以通过 DataFrame 的 apply 方法和 lambda 函数实现。

data['date'] = data.apply(lambda x: pd.datetime.strptime("{0} {1} {2}".format(x['year'],x['month'], x['day']), "%Y %m %d"),axis=1)

在上面的代码中,apply 方法会对 DataFrame 中的每一行数据进行处理。lambda 函数将年、月、日三列数据组合成一个字符串,再通过 strptime 方法将其转换成日期时间,最终得到一个新的日期时间列。

3. 输出结果

最后,使用 DataFrame 的 head 方法可以查看处理后的结果。

print(data.head())

输出结果如下:

   year  month  day       date
0  2021      3   15 2021-03-15
1  2021      3   16 2021-03-16
2  2021      3   17 2021-03-17
3  2021      3   18 2021-03-18
4  2021      3   19 2021-03-19

可以看到,原始的三列数据已经被组合成了一个新的日期时间列。这种操作在数据分析和处理中非常常见,在具体应用中可以根据实际需求进行调整和拓展。