📜  Python|熊猫系列.nunique()(1)

📅  最后修改于: 2023-12-03 15:19:21.887000             🧑  作者: Mango

Python熊猫系列.nunique()

简介

在Python熊猫(pandas)库中,.nunique()函数用于计算一维数组中不同值的数量(即去重后的数量)。此函数可用于Series对象和DataFrame对象。

语法
Series.nunique(dropna=True)
DataFrame.nunique(axis=0, dropna=True)
参数说明
  • Series.nunique()函数:

    • dropna:布尔(Boolean)型,默认为True,如果为True,则该函数在计算之前会删除所有NA/null值。
  • DataFrame.nunique()函数:

    • axis:整数(Integer)型,默认为0,该参数指定沿DataFrame的哪个轴计算唯一值的数量。当axis=0时,函数沿着DataFrame的行进行计算;当axis=1时,函数沿着DataFrame的列进行计算。
    • dropna:布尔(Boolean)型,默认为True,如果为True,则该函数在计算之前会删除所有NA/null值。
示例
Series.nunique()函数示例
import pandas as pd

s = pd.Series([1, 2, 3, 3, 4, 4, 5, None])
print(s.nunique())  # 输出:5,去重后的数量为5

s = pd.Series(['a', 'b', 'b', 'c', 'c', None])
print(s.nunique())  # 输出:3,去重后的数量为3(None将被视为一个独立的值)
DataFrame.nunique()函数示例
import pandas as pd

data = {'name': ['John', 'Mary', 'John', 'Mary'],
        'age': [25, 30, 25, 30],
        'gender': ['male', 'female', 'male', 'female']}

df = pd.DataFrame(data)
print(df.nunique())       # 输出:name:2, age:2, gender:2,分别表示每列不同值的数量
print(df.nunique(axis=1)) # 输出:0, 3, 3, 3,表示每行不同值的数量
结语

.nunique()函数是Python熊猫库中一个很有用的函数,可以帮助我们快速计算一维数组或Dataframe中不同值的数量。它对于处理缺失数据和清洗数据是非常有用的。如果您对此函数感兴趣,请查阅官方文档以获取更多信息。