📜  np 数组值计数 - Python (1)

📅  最后修改于: 2023-12-03 15:17:58.966000             🧑  作者: Mango

Numpy 数组值计数 - Python

在数据处理和分析中,我们通常会遇到需要统计数据元素出现次数的情况。Numpy 库为我们提供了相应的计数方法。

下面,我们来介绍如何使用 Numpy 库进行数组值计数。

numpy.unique()方法

numpy 库中的 unique() 方法返回输入数组中的唯一元素,并返回元素的数量和每个元素的索引。

import numpy as np

arr = np.array([1, 2, 3, 3, 4, 4, 4, 5])
unique, counts = np.unique(arr, return_counts=True)

print(np.asarray((unique, counts)).T)

输出结果:

array([[1, 1],
       [2, 1],
       [3, 2],
       [4, 3],
       [5, 1]])

以上结果表示 arr 数组中,元素 1 出现了1次,元素 2 出现了1次,元素 3 出现了2次,元素 4 出现了3次,元素 5 出现了1次。

pandas.value_counts()方法

pandas 库中的 value_counts() 方法返回 Series 中每个元素出现的数量。它通常用于对数据进行初步探索和分析。

import pandas as pd

arr = np.array([1, 2, 3, 3, 4, 4, 4, 5])
series = pd.Series(arr)

print(series.value_counts())

输出结果:

4    3
3    2
2    1
5    1
1    1
dtype: int64

以上结果表示 arr 数组中,元素 1 出现了1次,元素 2 出现了1次,元素 3 出现了2次,元素 4 出现了3次,元素 5 出现了1次。

总结

无论是使用 numpyunique() 方法还是 pandasvalue_counts() 方法,都可以进行数组中元素的值计数。其中,numpy 库更为底层,提供了更丰富的功能,而 pandas 库则更为高层,针对数据分析提供更加便捷的操作方式。