📌  相关文章
📜  数据框列计数中的唯一值 - Python (1)

📅  最后修改于: 2023-12-03 14:54:55.515000             🧑  作者: Mango

数据框列计数中的唯一值 - Python

在数据处理和分析中,我们常常需要对某些列中的唯一值进行计数。在Python中,可以使用Pandas库来完成该任务。

导入库

首先,我们需要导入Pandas库。

import pandas as pd
创建数据框

我们需要先创建一个包含若干列的数据框。这里我们以一个简单的例子来说明。

data = [['John', 'M', 20],
        ['Mary', 'F', 22],
        ['Tom', 'M', 20],
        ['Jane', 'F', 20],
        ['Bob', 'M', 22]]
df = pd.DataFrame(data, columns=['Name', 'Gender', 'Age'])

现在我们已经创建成功了一个包含三列的数据框。下面是该数据框的内容:

| Name | Gender | Age | | ---- | ------ | --- | | John | M | 20 | | Mary | F | 22 | | Tom | M | 20 | | Jane | F | 20 | | Bob | M | 22 |

对列计数中的唯一值进行计数

我们可以使用Pandas中的value_counts函数来对某一列中的唯一值进行计数。

例如,我们想要对Age这一列进行计数:

age_counts = df['Age'].value_counts()
print(age_counts)

输出结果为:

20    3
22    2
Name: Age, dtype: int64

可以看到,计数结果已经按照从大到小的顺序排列,每个唯一值的计数结果都已经显示出来了。

结论

Pandas提供了便捷的方法来对数据框中的唯一值进行计数,让数据处理和分析更为方便。