📅  最后修改于: 2023-12-03 14:40:38.320000             🧑  作者: Mango
用Python Pandas库处理时间序列数据时,经常需要从日期时间中提取日期,且不需要考虑具体时间。这个过程有点像将字符串中的子字符串提取出来一样,只需使用datetime索引来完成这个任务。
以下是一些代码示例和详细说明,展示如何从包含日期和时间的datetime列中筛选出日期。
首先,我们需要使用Pandas读取我们要操作的数据。在本例中,我们使用的是一个包含 'datetime' 列的数据集。
import pandas as pd
data = pd.read_csv('data.csv')
data['datetime'] = pd.to_datetime(data['datetime'])
一旦我们将'datetime'列转换为 Pandas的 datetime对象,我们就可以使用.dt
属性访问各种日期组成部分。例如,.dt.date
属性将返回列中的日期部分。
data['date'] = data['datetime'].dt.date
现在,我们创建了一个新列'date',其中包含仅由'datetime'列中的日期部分组成的日期对象。我们可以通过查看先前创建的日期对象来检查此操作是否成功。
print(data['date'])
输出为:
0 2020-01-01
1 2020-01-02
2 2020-01-03
Name: date, dtype: object
我们可以看到,新列仅包含日期部分,不包含具体时间。
以上就是从 Pandas中的'datetime'列中提取日期的简单说明。希望这些示例能够帮助你更好地处理包含日期和时间数据的任务。