📅  最后修改于: 2023-12-03 15:07:54.880000             🧑  作者: Mango
在Excel中,计数是一种非常常见的操作,在Python Pandas中,我们可以使用类似的方法进行计数操作。计数可以帮助我们快速了解数据中各列的情况,比如每一列中有多少个唯一的值,以及它们分别出现了多少次。
我们可以通过value_counts
方法快速统计某一列中各个值的个数,比如以下代码统计了df
中column
列中各个值的个数:
df['column'].value_counts()
我们可以通过该方法得到结果,结果为Series类型,其中index为每个唯一值,values为每个唯一值出现的次数。该方法已经将结果按照出现次数从大到小排序。若要进行升序排序,则可以加上参数ascending=True
。
如果我们需要统计多列唯一值的个数,我们可以使用groupby
方法和size
方法,比如以下代码统计了df
中column1
和column2
两列唯一值的个数:
df.groupby(['column1','column2']).size()
该方法返回的结果是一个多级索引(MultiIndex)的Series或DataFrame,其中每一级代表一个列,最后一级为列中唯一值的个数。
如果我们只需要求某一个列的唯一值数量,我们可以对结果在进行reset_index
方法,将多级索引转化为数据列,比如以下代码统计了df
中column1
列唯一值的个数:
df.groupby(['column1']).size().reset_index(name='count')
如果我们需要统计所有列的唯一值的个数,我们可以使用以下代码:
df.nunique()
该方法返回的结果为一个Series,其中index为每个列名,values为每个列的唯一值的个数。
以上就是Python Pandas中类似计数的Excel的介绍和说明。