📜  在 Pandas DataFrame 中查找和计算单个列的唯一值 - Python (1)

📅  最后修改于: 2023-12-03 15:23:14.634000             🧑  作者: Mango

在 Pandas DataFrame 中查找和计算单个列的唯一值 - Python

Pandas 是 Python 中用于数据处理和分析的常用库。在 Pandas DataFrame 中,我们经常需要查找和计算列的唯一值,这对于数据的统计和分析非常有用。本文将介绍如何在 Pandas DataFrame 中查找和计算单个列的唯一值。

查找单个列的唯一值

在 Pandas DataFrame 中,可以使用 unique() 方法来查找单个列的唯一值。下面是一个示例代码:

import pandas as pd

# 创建一个 DataFrame
df = pd.DataFrame({'fruit': ['apple', 'banana', 'apple', 'orange', 'banana']})

# 查找 fruit 列的唯一值
unique_fruit = df['fruit'].unique()

# 输出结果
print(unique_fruit)

运行结果如下:

['apple' 'banana' 'orange']

在上面的代码中,我们首先创建了一个 DataFrame,然后使用 unique() 方法查找了 fruit 列的唯一值。最后,我们将结果打印出来。

计算单个列的唯一值数量

除了查找单个列的唯一值,我们还可以使用 Pandas 的 value_counts() 方法计算单个列的唯一值数量。下面是一个示例代码:

import pandas as pd

# 创建一个 DataFrame
df = pd.DataFrame({'fruit': ['apple', 'banana', 'apple', 'orange', 'banana']})

# 计算 fruit 列的唯一值数量
fruit_counts = df['fruit'].value_counts()

# 输出结果
print(fruit_counts)

运行结果如下:

banana    2
apple     2
orange    1
Name: fruit, dtype: int64

在上面的代码中,我们首先创建了一个 DataFrame,然后使用 value_counts() 方法计算了 fruit 列的唯一值数量。最后,我们将结果打印出来。

总结

在本文中,我们介绍了如何在 Pandas DataFrame 中查找和计算单个列的唯一值。通过使用 Pandas 的 unique()value_counts() 方法,我们可以轻松地完成这些任务。这对于数据的统计和分析非常有用,希望本文对你有所帮助。