在Python Pandas 中执行类似计数的 Excel(1) - 芒果文档

📌 相关文章

📜 在Python Pandas 中执行类似计数的 Excel(1)

📅 最后修改于: 2023-12-03 15:07:54.880000 🧑 作者: Mango

在Python Pandas 中执行类似计数的 Excel

在Excel中，计数是一种非常常见的操作，在Python Pandas中，我们可以使用类似的方法进行计数操作。计数可以帮助我们快速了解数据中各列的情况，比如每一列中有多少个唯一的值，以及它们分别出现了多少次。

1. 统计唯一值的个数

我们可以通过value_counts方法快速统计某一列中各个值的个数，比如以下代码统计了df中column列中各个值的个数：

df['column'].value_counts()

我们可以通过该方法得到结果，结果为Series类型，其中index为每个唯一值，values为每个唯一值出现的次数。该方法已经将结果按照出现次数从大到小排序。若要进行升序排序，则可以加上参数ascending=True。

2. 统计多列唯一值的个数

如果我们需要统计多列唯一值的个数，我们可以使用groupby方法和size方法，比如以下代码统计了df中column1和column2两列唯一值的个数：

df.groupby(['column1','column2']).size()

该方法返回的结果是一个多级索引（MultiIndex）的Series或DataFrame，其中每一级代表一个列，最后一级为列中唯一值的个数。

如果我们只需要求某一个列的唯一值数量，我们可以对结果在进行reset_index方法，将多级索引转化为数据列，比如以下代码统计了df中column1列唯一值的个数：

df.groupby(['column1']).size().reset_index(name='count')

3. 统计所有列的唯一值的个数

如果我们需要统计所有列的唯一值的个数，我们可以使用以下代码：

df.nunique()

该方法返回的结果为一个Series，其中index为每个列名，values为每个列的唯一值的个数。

以上就是Python Pandas中类似计数的Excel的介绍和说明。