📅  最后修改于: 2023-12-03 14:45:04.685000             🧑  作者: Mango
在 Pandas 中,我们可以方便地计算列中唯一值的数量。本文将介绍如何使用 Pandas 计算列中唯一值的数量。
我们将使用以下数据作为示例:
import pandas as pd
data = {
'id': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'name': ['John', 'Jane', 'John', 'John', 'Kate', 'Kate', 'Jane', 'Jane', 'John', 'Kate'],
'age': [25, 27, 24, 22, 28, 26, 24, 26, 25, 27]
}
df = pd.DataFrame(data)
我们可以使用 value_counts() 方法计算列中每个唯一值的数量。例如,计算名字列中每个唯一值的数量:
name_counts = df['name'].value_counts()
print(name_counts)
输出:
John 4
Kate 3
Jane 3
Name: name, dtype: int64
这意味着在名字列中,John 出现了 4 次,Kate 和 Jane 出现了 3 次。
我们也可以使用 unique() 方法计算列中唯一值的数量。例如,计算名字列中的唯一值:
unique_names = df['name'].unique()
print(unique_names)
输出:
['John' 'Jane' 'Kate']
这意味着在名字列中,有三个唯一值:John、Jane 和 Kate。
要计算每个唯一值在列中出现的次数,我们可以使用 value_counts() 方法和 unique() 方法组合:
unique_name_counts = df['name'].value_counts()
print(unique_name_counts)
输出:
John 4
Kate 3
Jane 3
Name: name, dtype: int64
这意味着在名字列中,John 出现了 4 次,Kate 和 Jane 出现了 3 次。
我们还可以使用 nunique() 方法计算列中唯一值的数量。例如,计算名字列中的唯一值数量:
unique_name_count = df['name'].nunique()
print(unique_name_count)
输出:
3
这意味着在名字列中,有三个唯一值:John、Jane 和 Kate。
注意,与 value_counts() 方法和 unique() 方法不同的是,nunique() 方法返回的是唯一值数量的整数,而不是一个 Series 对象。
在 Pandas 中,我们可以使用 value_counts() 方法、unique() 方法和 nunique() 方法计算列中唯一值的数量。这些方法可以帮助我们快速了解数据中的唯一值的分布。