📅  最后修改于: 2023-12-03 15:41:26.897000             🧑  作者: Mango
对于需要对数据进行统计分析的程序员来说,经常需要获取 Pandas 列中各个值出现的次数。在 Python 中,Pandas 库提供了非常方便的方法可以用来实现这个功能。
以下是一个示例数据集:
import pandas as pd
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob'],
'age': [25, 30, 35, 25, 30],
'gender': ['F', 'M', 'M', 'F', 'M']
})
该数据集包含三列:name
、age
和 gender
。现在我们想要获取 name
列中各个值的计数。
可以通过 value_counts()
方法来获取 Pandas 列中各个值的计数:
name_counts = df['name'].value_counts()
print(name_counts)
以上代码将输出以下结果:
Alice 2
Bob 2
Charlie 1
Name: name, dtype: int64
在这个结果中,每个值和它出现的次数都被记录下来了。
value_counts()
方法属于 Pandas Series 对象,它可以获取某一列中各个值出现的次数,返回的结果是一个 Pandas Series 对象。value_counts()
方法的参数可以指定排序方式,是否包含缺失值等。
在以上的示例代码中,我们使用 df['name']
方法来获得 Pandas 数据集中的 name
列,再调用 value_counts()
方法即可获取每个人名出现的次数。
获取 Pandas 列中各个值的计数是数据分析过程中非常常见的需求,使用 Pandas 的 value_counts()
方法可以轻松地完成这项工作。在实际的使用中,程序员还需要注意其他参数的配置,比如排序方式等。