Python|熊猫系列.clip()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Python Series.clip()
用于将下方和上方的值裁剪为传递的最小和最大值。在执行信号处理等操作时会使用此方法。众所周知,数字信号中只有两个值,高或低。 Pandas Series.clip()
可用于将值限制为特定范围。
Syntax: Series.clip(lower=None, upper=None, axis=None, inplace=False)
Parameters:
lower: Sets Least value of range. Any values below this are made equal to lower.
upper: Sets Max value of range. Any values above this are made equal to upper.
axis: 0 or ‘index’ to apply method by rows and 1 or ‘columns’ to apply by columns
inplace: Make changes in the caller series itself. (Overwrite with new values)
Return type: Series with updated values
要下载以下示例中使用的数据集,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
例子
在此示例中, .clip()
方法在数据的 Age 列上调用。将最小值 22 传递给下参数,将 25 传递给上参数。然后将返回的系列存储在新列“新时代”中。在执行任何操作之前,使用.dropna()
删除空行以避免错误。
# importing pandas module
import pandas as pd
# importing regex module
import re
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# lower value of range
lower = 22
# upper value of range
upper = 25
# passing values to new column
data["New Age"]= data["Age"].clip(lower = lower, upper = upper)
# display
data
输出:
如输出图像所示,New Age 列的最小值为 22,最大值为 25。所有值都限制在此范围内。低于 22 的值等于 22,高于 25 的值等于 25。