📅  最后修改于: 2023-12-03 15:24:18.654000             🧑  作者: Mango
在 Pandas 数据处理中,我们需要经常查询数据中的唯一值。本文将介绍如何在 Pandas 的列中查找唯一值。
Pandas 提供了许多方法来查找唯一值。以下是其中的一些方法:
unique()
方法unique()
方法可以查找 Pandas 列中的唯一值。举个例子,我们有一个数据集,其中包含一列国家名称,我们需要查找该列中的唯一值:
import pandas as pd
data = {'Country': ['China', 'India', 'USA', 'Russia', 'China', 'India']}
df = pd.DataFrame(data)
unique_values = df['Country'].unique()
print(unique_values)
输出结果为:
['China' 'India' 'USA' 'Russia']
nunique()
方法nunique()
方法可以返回 Pandas 列中唯一值的数量。例如,我们需要计算上面例子中的国家名称列中唯一值的数量,可以使用以下代码:
import pandas as pd
data = {'Country': ['China', 'India', 'USA', 'Russia', 'China', 'India']}
df = pd.DataFrame(data)
unique_count = df['Country'].nunique()
print(unique_count)
输出结果为:
4
value_counts()
方法value_counts()
方法可以返回 Pandas 列中各个值出现的次数。例如,我们需要计算上面例子中的国家名称列中各个值出现的次数,可以使用以下代码:
import pandas as pd
data = {'Country': ['China', 'India', 'USA', 'Russia', 'China', 'India']}
df = pd.DataFrame(data)
value_counts = df['Country'].value_counts()
print(value_counts)
输出结果为:
China 2
India 2
USA 1
Russia 1
Name: Country, dtype: int64
Pandas 提供了多种方法来查找唯一值以及统计各值出现的次数。选择其中的一种方法来处理数据取决于你的具体需求。希望本文对你理解 Pandas 数据处理有所帮助!