📜  Python|熊猫系列.nunique()

📅  最后修改于: 2022-05-13 01:55:03.284000             🧑  作者: Mango

Python|熊猫系列.nunique()

Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas 就是其中之一,它使导入和分析数据变得更加容易。

在分析数据时,很多时候用户希望查看特定列中的唯一值。 Pandas nunique()用于获取唯一值的计数。

要下载使用的 CSV 文件,请单击此处。

示例 #1:使用 nunique()
在此示例中,使用 nunique() 方法获取 Team 列中所有唯一值的数量。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# storing unique value in a variable
unique_value = data["Team"].nunique()
  
# printing value
print(unique_value)

输出:
返回唯一值数量的输出。

10


示例 #2: NULL 值处理
在此示例中,将 unique() 方法返回的数组长度与 nunique() 方法返回的整数进行比较。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# storing unique value in a variable
arr = data["Team"].unique()
  
# storing unique value in a variable
unique_value = data["Team"].nunique(dropna = True)
  
# printing values
print(len(arr), unique_value)

输出:
两种情况下的输出都不相同,因为 dropna 参数设置为 True ,因此在计算唯一值时会排除 NULL 值。

11 10