Python|熊猫 dataframe.nunique()
Python是一种用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。
Pandas dataframe.nunique()
函数返回 Series,其中包含请求轴上不同观察值的数量。如果我们将轴的值设置为 0,那么它会找到索引轴上唯一观察值的总数。如果我们将轴的值设置为 1,那么它会找到列轴上唯一观察值的总数。它还提供了从唯一数字计数中排除NaN
值的功能。
Syntax: DataFrame.nunique(axis=0, dropna=True)
Parameters :
axis : {0 or ‘index’, 1 or ‘columns’}, default 0
dropna : Don’t include NaN in the counts.
Returns : nunique : Series
示例 #1:使用nunique()
函数查找列轴上唯一值的数量。
# importing pandas as pd
import pandas as pd
# Creating the first dataframe
df = pd.DataFrame({"A":[14, 4, 5, 4, 1],
"B":[5, 2, 54, 3, 2],
"C":[20, 20, 7, 3, 8],
"D":[14, 3, 6, 2, 6]})
# Print the dataframe
df
让我们使用dataframe.nunique()
函数来查找列轴上的唯一值。
# find unique values
df.nunique(axis = 1)
输出 :
正如我们在输出中看到的,该函数打印总数。每行中的唯一值。示例 #2:使用nunique()
函数查找数据帧中索引轴上唯一值的数量。数据框包含NaN
值。
# importing pandas as pd
import pandas as pd
# Creating the first dataframe
df = pd.DataFrame({"A":["Sandy", "alex", "brook", "kelly", np.nan],
"B":[np.nan, "olivia", "olivia", "", "amanda"],
"C":[20 + 5j, 20 + 5j, 7, None, 8],
"D":[14.8, 3, None, 6, 6]})
# apply the nunique() function
df.nunique(axis = 0, dropna = True)
输出 :
该函数将空字符串视为第 2 列中的唯一值。