Python|熊猫 dataframe.diff()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas dataframe.diff()
用于查找对象在给定轴上的第一个离散差异。我们可以提供一个周期值来移动以形成差异。
Syntax: DataFrame.diff(periods=1, axis=0)
Parameters:
periods : Periods to shift for forming difference
axis : Take difference over rows (0) or columns (1).
Returns: diffed : DataFrame
示例 #1:使用diff()
函数在索引轴上找到周期值等于 1 的离散差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[5, 3, 6, 4],
"B":[11, 2, 4, 3],
"C":[4, 3, 8, 5],
"D":[5, 4, 2, 8]})
# Print the dataframe
df
现在找到索引轴上的离散差。
# To find the discrete difference
df.diff(axis = 0, periods = 1)
输出 :
输出是一个数据框,其中的单元格包含索引轴上的离散差异。每个单元格中存在的值是当前单元格值与上一行对应单元格的差值。注意,第一行是NaN
填充的。这是因为在其上方没有可以找到差异的行,因此将其视为NaN
。
示例 #2:使用diff()
函数在列轴上找到周期值等于 1 的离散差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[5, 3, 6, 4],
"B":[11, 2, 4, 3],
"C":[4, 3, 8, 5],
"D":[5, 4, 2, 8]})
# To find the discrete difference
df.diff(axis = 1, periods = 1)
输出 :
输出是一个数据框,其中的单元格包含列轴上的离散差异。每个单元格中存在的值是当前单元格值与上一列对应单元格的差值。注意,第一列是NaN
填充的。这是因为它的左侧没有列可以找到差异,因此它被视为NaN
。