📌  相关文章
📜  获取 pandas 列中的值的计数 - Python (1)

📅  最后修改于: 2023-12-03 15:41:26.897000             🧑  作者: Mango

获取 Pandas 列中的值的计数 - Python

对于需要对数据进行统计分析的程序员来说,经常需要获取 Pandas 列中各个值出现的次数。在 Python 中,Pandas 库提供了非常方便的方法可以用来实现这个功能。

示例代码

以下是一个示例数据集:

import pandas as pd

df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
    'age': [25, 30, 35, 25, 30],
    'gender': ['F', 'M', 'M', 'F', 'M']
})

该数据集包含三列:nameagegender。现在我们想要获取 name 列中各个值的计数。

可以通过 value_counts() 方法来获取 Pandas 列中各个值的计数:

name_counts = df['name'].value_counts()

print(name_counts)

以上代码将输出以下结果:

Alice      2
Bob        2
Charlie    1
Name: name, dtype: int64

在这个结果中,每个值和它出现的次数都被记录下来了。

解释说明

value_counts() 方法属于 Pandas Series 对象,它可以获取某一列中各个值出现的次数,返回的结果是一个 Pandas Series 对象。value_counts() 方法的参数可以指定排序方式,是否包含缺失值等。

在以上的示例代码中,我们使用 df['name'] 方法来获得 Pandas 数据集中的 name 列,再调用 value_counts() 方法即可获取每个人名出现的次数。

总结

获取 Pandas 列中各个值的计数是数据分析过程中非常常见的需求,使用 Pandas 的 value_counts() 方法可以轻松地完成这项工作。在实际的使用中,程序员还需要注意其他参数的配置,比如排序方式等。