Python|熊猫 DataFrame.nsmallest()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas nsmallest()方法用于从数据帧或序列中获取 n 个最小值。
Syntax: DataFrame.nsmallest(n, columns, keep=’first’)
Parameters:
n: int, Number of values to select
columns: Column to check for least values or user can select column while calling too. [For example: data[“age”].nsmallest(3) OR data.nsmallest(3, “age”)]
keep: object to set which value to select if duplicates exit. Options are ‘first’ or ‘last’.
要下载使用的 CSV 文件,请单击此处。
示例 #1:提取至少 5 个值
在此示例中,至少提取了 5 个值,然后与由 sort_values()函数排序的另一个值进行比较。
在尝试此方法之前删除 NaN 值。
请参阅 sort_values 和 dropna()。
Python
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# removing null values
data.dropna(inplace = True)
# extracting least 5
least5 = data.nsmallest(5, "Salary")
# display
least5
Python
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# removing null values
data.dropna(inplace = True)
# sorting in ascending order
data.sort_values("Salary", ascending = True, inplace = True)
# displaying top 5 values
data.head()
输出:
示例 #2:按 sort_values() 排序
Python
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# removing null values
data.dropna(inplace = True)
# sorting in ascending order
data.sort_values("Salary", ascending = True, inplace = True)
# displaying top 5 values
data.head()
输出:
如输出图像所示,两个函数返回的值相似。