📜  在Python Pandas 中执行类似计数的 Excel(1)

📅  最后修改于: 2023-12-03 15:07:54.880000             🧑  作者: Mango

在Python Pandas 中执行类似计数的 Excel

在Excel中,计数是一种非常常见的操作,在Python Pandas中,我们可以使用类似的方法进行计数操作。计数可以帮助我们快速了解数据中各列的情况,比如每一列中有多少个唯一的值,以及它们分别出现了多少次。

1. 统计唯一值的个数

我们可以通过value_counts方法快速统计某一列中各个值的个数,比如以下代码统计了dfcolumn列中各个值的个数:

df['column'].value_counts()

我们可以通过该方法得到结果,结果为Series类型,其中index为每个唯一值,values为每个唯一值出现的次数。该方法已经将结果按照出现次数从大到小排序。若要进行升序排序,则可以加上参数ascending=True

2. 统计多列唯一值的个数

如果我们需要统计多列唯一值的个数,我们可以使用groupby方法和size方法,比如以下代码统计了dfcolumn1column2两列唯一值的个数:

df.groupby(['column1','column2']).size()

该方法返回的结果是一个多级索引(MultiIndex)的Series或DataFrame,其中每一级代表一个列,最后一级为列中唯一值的个数。

如果我们只需要求某一个列的唯一值数量,我们可以对结果在进行reset_index方法,将多级索引转化为数据列,比如以下代码统计了dfcolumn1列唯一值的个数:

df.groupby(['column1']).size().reset_index(name='count')
3. 统计所有列的唯一值的个数

如果我们需要统计所有列的唯一值的个数,我们可以使用以下代码:

df.nunique()

该方法返回的结果为一个Series,其中index为每个列名,values为每个列的唯一值的个数。

以上就是Python Pandas中类似计数的Excel的介绍和说明。