📅  最后修改于: 2023-12-03 15:08:23.279000             🧑  作者: Mango
在数据分析和处理中,经常需要从 Excel 文件中提取时间数据。Pandas 是一个强大的 Python 数据分析库,可以很方便地从 Excel 文件中提取和处理时间数据。
假设我们有一个 Excel 文件,其中有一个名为 "date" 的列,里面存储了时间数据。我们可以采用以下步骤从中提取时间数据:
import pandas as pd
df = pd.read_excel('file.xlsx')
df['date'] = pd.to_datetime(df['date'])
year = df['date'].dt.year
month = df['date'].dt.month
day = df['date'].dt.day
hour = df['date'].dt.hour
minute = df['date'].dt.minute
second = df['date'].dt.second
df['year'] = year
df['month'] = month
df['day'] = day
df['hour'] = hour
df['minute'] = minute
df['second'] = second
以下是一个完整的示例,展示了如何从 Excel 文件中提取时间数据并添加到 DataFrame 中:
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('file.xlsx')
# 将 "date" 列转换为 Pandas 中的 datetime 类型
df['date'] = pd.to_datetime(df['date'])
# 提取时间数据
year = df['date'].dt.year
month = df['date'].dt.month
day = df['date'].dt.day
hour = df['date'].dt.hour
minute = df['date'].dt.minute
second = df['date'].dt.second
# 将提取出的时间数据添加到 DataFrame 中
df['year'] = year
df['month'] = month
df['day'] = day
df['hour'] = hour
df['minute'] = minute
df['second'] = second
# 输出 DataFrame
print(df)
输出结果如下:
date year month day hour minute second
0 2019-01-01 2019 1 1 0 0 0
1 2019-02-01 2019 2 1 0 0 0
2 2019-03-01 2019 3 1 0 0 0
3 2019-04-01 2019 4 1 0 0 0
4 2019-05-01 2019 5 1 0 0 0
5 2019-06-01 2019 6 1 0 0 0
6 2019-07-01 2019 7 1 0 0 0
7 2019-08-01 2019 8 1 0 0 0
8 2019-09-01 2019 9 1 0 0 0
9 2019-10-01 2019 10 1 0 0 0