📌  相关文章
📜  如何获取 pandas 中所有列的唯一值 - Python (1)

📅  最后修改于: 2023-12-03 14:53:15.469000             🧑  作者: Mango

如何获取 Pandas 中所有列的唯一值 - Python

Pandas 是一个强大的数据分析库,提供了很多方便操作数据的函数。如果你需要获取数据集中所有列的唯一值,可以使用 Pandas 的 unique() 函数来实现。

操作方法

以下是 Pandas 中获取唯一值的方法:

import pandas as pd

# 创建数据集
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Bob'],
        'age': [25, 20, 18, 32, 20],
        'gender': ['F', 'M', 'M', 'M', 'M']}

# 创建 DataFrame
df = pd.DataFrame(data)

# 获取所有列的唯一值
unique_values = {}
for col in df.columns:
    unique_values[col] = df[col].unique()

print(unique_values)

输出结果为:

{'name': array(['Alice', 'Bob', 'Charlie', 'David'], dtype=object),
 'age': array([25, 20, 18, 32]),
 'gender': array(['F', 'M'], dtype=object)}
分析

上述代码中,我们首先创建了一个包含姓名、年龄和性别信息的数据集,然后使用 pd.DataFrame() 函数将其转换为 DataFrame。接着,我们使用一个循环语句,遍历所有列,使用 unique() 函数获取该列的唯一值,最后将结果存储在字典 unique_values 中。

总结

使用 Pandas 的 unique() 函数可以方便地获取数据集中所有列的唯一值。这是数据分析和数据清洗过程中经常用到的操作之一。