📅  最后修改于: 2023-12-03 15:04:07.284000             🧑  作者: Mango
在 Pandas 里的数据处理之中,窗口函数可以使得我们对一个数据进行全局的计算,还能够保留数据原有的结构。窗口函数可以是以下任意一种:
Pandas 提供了很多窗口函数,如 mean、sum、count、std、var、min、max 等等。
在了解 Pandas 窗口函数之前,建议你掌握:
Pandas 中的基本知识,最好做过相关的练习;
Python 中的基本知识,了解基本的 Python 语言核心、数据类型与函数;
数据前处理的基本技能,包括读取文件、获得所需的字段、数据类型转化等等。
下面我们通过一个具体的实例,来了解 Pandas 窗口函数的使用。
import numpy as np
import pandas as pd
df = pd.read_csv('data.csv', index_col='date')
df['rolling_mean_5'] = df['value'].rolling(window=5).mean()
df['rolling_mean_10'] = df['value'].rolling(window=10).mean()
在这个代码执行过程中,我们首先选定了一个指标 value,对这个指标进行滑动窗口的处理(窗口宽度分别是 5 和 10),再将处理过的指标保存到两个新的列 rolling_mean_5 和 rolling_mean_10 之中。
本篇介绍了 Pandas 窗口函数的基本知识,介绍了窗口函数的性质和使用步骤。掌握了这些技术之后,我们可以对时间序列数据进行更全面的处理。