Python|熊猫 DataFrame.nlargest()

Python是一种用于进行数据分析的出色语言，主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一，它使导入和分析数据变得更加容易。

Pandas nlargest()方法用于从数据帧或序列中获取 n 个最大值。

句法：

DataFrame.nlargest(n, columns, keep='first')

参数：

n: int, Number of values to select
columns: Column to check for values or user can select column while calling too. [For example: data[“age”].nsmallest(3) OR data.nsmallest(3, “age”)]

keep: object to set which value to select if duplicates exit. Options are ‘first’ or ‘last’

编程需要懂一点英语

要下载使用的 CSV 文件，请单击此处。

代码 #1：提取最大的 5 个值
在此示例中，提取了最大的 5 个值，然后与通过 sort_values()函数排序的另一个值进行比较。在尝试此方法之前删除 NaN 值。

请参阅 sort_values 和 dropna()函数。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# removing null values
data.dropna(inplace = True)
  
# extracting greatest 5
large5 = data.nlargest(5, "Salary")
  
# display
large5

输出：

代码 #2：按 sort_values() 排序

# importing pandas package
import pandas as pd
  
# making data frame from csv file 
data = pd.read_csv("employees.csv")
  
# removing null values
data.dropna(inplace = True)
  
# sorting in descending order
data.sort_values("Salary", ascending = False, inplace = True)
  
# displaying top 5 values
data.head()

输出：

如输出图像所示，两个函数返回的值相似。