Python|熊猫系列.gt()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas Series.gt()用于比较两个系列并为每个元素返回布尔值。
Syntax: Series.gt(other, level=None, fill_value=None, axis=0)
Parameters:
other: other series to be compared with
level: int or name of level in case of multi level
fill_value: Value to be replaced instead of NaN
axis: 0 or ‘index’ to apply method by rows and 1 or ‘columns’ to apply by columns.
Return type: Boolean series
注意:结果是根据比较调用者系列>其他系列返回的。
要下载以下示例中使用的数据集,请单击此处。
在以下示例中,使用的数据框包含一些 NBA 球员的数据。下面附上任何操作之前的数据帧图像。
示例 1:
在此示例中,年龄列和体重列使用 .gt() 方法进行比较。由于重量列中的值与年龄列相比非常大,因此首先将值除以 10。在比较之前,使用 .dropna() 方法删除空行以避免错误。
Python3
# importing pandas module
import pandas as pd
# importing regex module
import re
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(inplace = True)
# other series
other = data["Weight"]/10
# calling method and returning to new column
data["Age > Weight"]= data["Age"].gt(other)
Python3
# importing pandas module
import pandas as pd
# importing numpy module
import numpy as np
# creating series 1
series1 = pd.Series([24, 19, 2, 33, 49, 7, np.nan, 10, np.nan])
# creating series 2
series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 9])
# setting null replacement value
na_replace = 5
# calling and storing result
result = series1.gt(series2, fill_value = na_replace)
# display
result
输出:
如输出图像所示,只要 Age 列中的值大于 Weight/10,新列的值为 True。
示例 2:处理 NaN 值
在此示例中,使用 pd.Series() 创建了两个系列。该系列也包含空值,因此将 5 传递给 fill_value 参数以将空值替换为 5。
Python3
# importing pandas module
import pandas as pd
# importing numpy module
import numpy as np
# creating series 1
series1 = pd.Series([24, 19, 2, 33, 49, 7, np.nan, 10, np.nan])
# creating series 2
series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 9])
# setting null replacement value
na_replace = 5
# calling and storing result
result = series1.gt(series2, fill_value = na_replace)
# display
result
输出:
从输出中可以看出,NaN 值被 5 替换,替换后执行比较,并使用新值进行比较。
0 True
1 True
2 False
3 True
4 True
5 False
6 False
7 True
8 False
dtype: bool