Python|熊猫 dataframe.clip()
Python是用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas dataframe.clip()
用于修剪指定输入阈值的值。我们可以使用此函数为数据框中任何单元格可以具有的值设置下限和上限。
Syntax: DataFrame.clip(lower=None, upper=None, axis=None, inplace=False, *args, **kwargs)
Parameters:
lower : Minimum threshold value. All values below this threshold will be set to it.
upper : Maximum threshold value. All values above this threshold will be set to it.
axis : Align object with lower and upper along the given axis.
inplace : Whether to perform the operation in place on the data.
*args, **kwargs : Additional keywords have no effect but might be accepted for compatibility with numpy.
示例 #1:使用clip()
函数修剪低于和高于给定阈值的数据帧的值。
# importing pandas as pd
import pandas as pd
# Creating a dataframe using dictionary
df = pd.DataFrame({"A":[-5, 8, 12, -9, 5, 3],
"B":[-1, -4, 6, 4, 11, 3],
"C":[11, 4, -8, 7, 3, -2]})
# Printing the data frame for visualization
df
现在修剪所有低于 -4 到 -4 的值以及高于 9 到 9 的所有值。介于 -4 和 9 之间的值保持不变。
# Clip in range (-4, 9)
df.clip(-4, 9)
输出 :
注意,数据框中没有任何值大于 9 且小于 -4示例 #2:使用clip()
函数使用数据帧中每个列元素的特定下限和上限阈值进行剪辑。
# importing pandas as pd
import pandas as pd
# Creating a dataframe using dictionary
df = pd.DataFrame({"A":[-5, 8, 12, -9, 5, 3],
"B":[-1, -4, 6, 4, 11, 3],
"C":[11, 4, -8, 7, 3, -2]})
# Printing the dataframe
df
当axis=0
时,该值将被剪裁到各行中。我们将为所有列元素提供上限和下限(即相当于行数)
创建一个系列来存储每个列元素的下限和上限阈值。
# lower limit for each individual column element.
lower_limit = pd.Series([1, -3, 2, 3, -2, -1])
# upper limit for each individual column element.
upper_limit = lower_limit + 5
# Print lower_limit
lower_limit
# Print upper_limit
upper_limit
输出 :
现在我们想对数据框应用这些限制。
# applying different limit value for each column element
df.clip(lower_limit, upper_limit, axis = 0)
输出 :