📌  相关文章
📜  返回唯一值 pandas 的计数 - Python (1)

📅  最后修改于: 2023-12-03 14:57:56.290000             🧑  作者: Mango

返回唯一值 pandas 的计数 - Python

在数据分析和处理中,我们经常需要统计某个列(Series)中各个值出现的次数。这时我们可以使用 pandas 库中的 value_counts() 方法。这个方法返回一个 Series,其中包含不同值出现的次数。但是,如果我们只想得到不同值的个数,我们可以使用 nunique() 方法。以下将介绍如何使用 nunique() 方法。

nunique() 方法

nunique() 方法是 pandas 库中的一个函数,用于返回给定列唯一值的个数,忽略掉缺失值。具体地,这个函数可以传入一些参数,例如是否应该考虑空值、返回形式等等。

下面是一个例子:

import pandas as pd

data = pd.Series(['a', 'b', 'b', 'c', 'c', 'c', 'd', pd.NA])
unique_values = data.nunique()
print(f"Unique values: {unique_values}")

输出结果为:

Unique values: 4

在上述代码中,我们使用 Series 类来创建了一个包含一些值的序列。然后,我们调用 nunique() 方法来获取这些值中唯一值的数量。这里注意,我们使用了 pandas.NA 来表示一个缺失值。nunique() 方法会忽略掉这样的值。

同样,我们还可以使用 drop_duplicates() 方法来获取唯一值,然后用 len() 方法统计其个数。但是 nunique() 方法比 drop_duplicates() 更加高效,因为它直接返回结果,而不是先计算唯一值,然后再统计他们的个数。

unique_values = len(data.drop_duplicates())
总结

通过本文的介绍,你应该已经知道了如何使用 nunique() 方法来返回唯一值 pandas 的计数。这个方法非常高效,可以避免我们多次遍历表格或者序列,从而提高代码的效率。如果你需要获取唯一值的具体信息,例如出现次数等等,那么你可以使用 value_counts() 方法来实现。