📜  Python|熊猫 DataFrame.nlargest()(1)

📅  最后修改于: 2023-12-03 15:04:26.760000             🧑  作者: Mango

Python | 熊猫 DataFrame.nlargest()

简介

在熊猫中,DataFrame.nlargest()是一种获取DataFrame中最大值的行的方法。它允许选择要排序的列,并允许指定要返回的行数。

语法
DataFrame.nlargest(self, n, columns, keep='first')
参数
  • n: 要返回的行数
  • columns: 要排序的列
  • keep: 如果有重复的行,指定要保留的行。默认为'first',即保留第一次出现的行,还可以选择'last',即保留最后一次出现的行。
示例

假设我们有以下数据:

import pandas as pd

df = pd.DataFrame({
    'Name': ['Tom', 'Jerry', 'Mike', 'Mary', 'Alice'],
    'Age': [25, 31, 29, 26, 28],
    'Gender': ['M', 'M', 'M', 'F', 'F']
})

要找到年龄最大的三个人,我们可以使用nlargest()

df.nlargest(3, 'Age')

输出结果如下:

    Name   Age Gender
1  Jerry  31    M
2  Mike   29    M
4  Alice  28    F

在这个例子中,我们将n设置为3,它返回了年龄最大的三个人的行。我们将列名称'Age'传递给column参数,以根据这一列进行排序。

注意事项
  • 由于nlargest()是一种方法,因此必须在一个数据框上调用它。
  • 如果我们要按多个列排序,则可以通过将列名称作为列表传递给columns参数来达到目的。例如:df.nlargest(3, ['Age', 'Name'])将首先按'Age'列排序,然后按'Name'列排序。
  • 如果我们想要获取最小值而不是最大值,则可以使用nsmallest()方法。