📅  最后修改于: 2023-12-03 15:19:21.887000             🧑  作者: Mango
在Python熊猫(pandas)库中,.nunique()函数用于计算一维数组中不同值的数量(即去重后的数量)。此函数可用于Series对象和DataFrame对象。
Series.nunique(dropna=True)
DataFrame.nunique(axis=0, dropna=True)
Series.nunique()函数:
DataFrame.nunique()函数:
import pandas as pd
s = pd.Series([1, 2, 3, 3, 4, 4, 5, None])
print(s.nunique()) # 输出:5,去重后的数量为5
s = pd.Series(['a', 'b', 'b', 'c', 'c', None])
print(s.nunique()) # 输出:3,去重后的数量为3(None将被视为一个独立的值)
import pandas as pd
data = {'name': ['John', 'Mary', 'John', 'Mary'],
'age': [25, 30, 25, 30],
'gender': ['male', 'female', 'male', 'female']}
df = pd.DataFrame(data)
print(df.nunique()) # 输出:name:2, age:2, gender:2,分别表示每列不同值的数量
print(df.nunique(axis=1)) # 输出:0, 3, 3, 3,表示每行不同值的数量
.nunique()函数是Python熊猫库中一个很有用的函数,可以帮助我们快速计算一维数组或Dataframe中不同值的数量。它对于处理缺失数据和清洗数据是非常有用的。如果您对此函数感兴趣,请查阅官方文档以获取更多信息。