📅  最后修改于: 2023-12-03 14:53:15.469000             🧑  作者: Mango
Pandas 是一个强大的数据分析库,提供了很多方便操作数据的函数。如果你需要获取数据集中所有列的唯一值,可以使用 Pandas 的 unique()
函数来实现。
以下是 Pandas 中获取唯一值的方法:
import pandas as pd
# 创建数据集
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Bob'],
'age': [25, 20, 18, 32, 20],
'gender': ['F', 'M', 'M', 'M', 'M']}
# 创建 DataFrame
df = pd.DataFrame(data)
# 获取所有列的唯一值
unique_values = {}
for col in df.columns:
unique_values[col] = df[col].unique()
print(unique_values)
输出结果为:
{'name': array(['Alice', 'Bob', 'Charlie', 'David'], dtype=object),
'age': array([25, 20, 18, 32]),
'gender': array(['F', 'M'], dtype=object)}
上述代码中,我们首先创建了一个包含姓名、年龄和性别信息的数据集,然后使用 pd.DataFrame()
函数将其转换为 DataFrame。接着,我们使用一个循环语句,遍历所有列,使用 unique()
函数获取该列的唯一值,最后将结果存储在字典 unique_values
中。
使用 Pandas 的 unique()
函数可以方便地获取数据集中所有列的唯一值。这是数据分析和数据清洗过程中经常用到的操作之一。