📅  最后修改于: 2023-12-03 14:57:56.290000             🧑  作者: Mango
在数据分析和处理中,我们经常需要统计某个列(Series)中各个值出现的次数。这时我们可以使用 pandas 库中的 value_counts()
方法。这个方法返回一个 Series,其中包含不同值出现的次数。但是,如果我们只想得到不同值的个数,我们可以使用 nunique()
方法。以下将介绍如何使用 nunique()
方法。
nunique()
方法nunique()
方法是 pandas 库中的一个函数,用于返回给定列唯一值的个数,忽略掉缺失值。具体地,这个函数可以传入一些参数,例如是否应该考虑空值、返回形式等等。
下面是一个例子:
import pandas as pd
data = pd.Series(['a', 'b', 'b', 'c', 'c', 'c', 'd', pd.NA])
unique_values = data.nunique()
print(f"Unique values: {unique_values}")
输出结果为:
Unique values: 4
在上述代码中,我们使用 Series
类来创建了一个包含一些值的序列。然后,我们调用 nunique()
方法来获取这些值中唯一值的数量。这里注意,我们使用了 pandas.NA
来表示一个缺失值。nunique()
方法会忽略掉这样的值。
同样,我们还可以使用 drop_duplicates()
方法来获取唯一值,然后用 len()
方法统计其个数。但是 nunique()
方法比 drop_duplicates()
更加高效,因为它直接返回结果,而不是先计算唯一值,然后再统计他们的个数。
unique_values = len(data.drop_duplicates())
通过本文的介绍,你应该已经知道了如何使用 nunique()
方法来返回唯一值 pandas 的计数。这个方法非常高效,可以避免我们多次遍历表格或者序列,从而提高代码的效率。如果你需要获取唯一值的具体信息,例如出现次数等等,那么你可以使用 value_counts()
方法来实现。