Python|熊猫系列.diff()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas Series.diff()
用于查找同一系列元素之间的差异。差异是连续的,取决于传递给diff()
方法的周期参数。
Syntax: Series.diff(periods=1)
Parameters:
periods: integer value, subtracts element before/after period from current element. Negative values are also accepted
Return type: Series
例子:
在此示例中,从Python列表创建了两个系列。 diff()
方法在两个系列上都被调用,一次是正周期,一次是负值传递给周期参数。
# importing pandas module
import pandas as pd
# importing numpy module
import numpy as np
# creating list
list =[15, 2, 34, 12, 4, 0, 9, 7]
# creating series
series = pd.Series(list)
# calling method with period 2
period2 = series.diff(2)
# Passing Negative value to period
# passing period of -1
period_1 = series.diff(-1)
# display
print('Diff with period 2:\n{}\n\
Diff with period -1:\n{}'.format(period2, period_1))
输出:
Diff with period 2:
0 NaN
1 NaN
2 19.0
3 10.0
4 -30.0
5 -12.0
6 5.0
7 7.0
dtype: float64
Diff with period -1:
0 13.0
1 -32.0
2 22.0
3 8.0
4 4.0
5 -9.0
6 2.0
7 NaN
dtype: float64
解释:在第 2 个周期的第一个输出中,从第 (i+2) 个位置减去第 i 个位置的值并存储在第 (i+2) 个位置。在第二个输出中,从第 (i-1) 个位置的值中减去第 i 个位置的值并存储在第 (i-1) 个位置。
注意:输出系列中的第一个/最后一个 n 值是 NaN,具体取决于周期的符号。(如果周期为正则为第一个,如果为负,则为最后一个,其中 n 为周期)。