📅  最后修改于: 2023-12-03 15:17:58.966000             🧑  作者: Mango
在数据处理和分析中,我们通常会遇到需要统计数据元素出现次数的情况。Numpy 库为我们提供了相应的计数方法。
下面,我们来介绍如何使用 Numpy 库进行数组值计数。
numpy
库中的 unique()
方法返回输入数组中的唯一元素,并返回元素的数量和每个元素的索引。
import numpy as np
arr = np.array([1, 2, 3, 3, 4, 4, 4, 5])
unique, counts = np.unique(arr, return_counts=True)
print(np.asarray((unique, counts)).T)
输出结果:
array([[1, 1],
[2, 1],
[3, 2],
[4, 3],
[5, 1]])
以上结果表示 arr
数组中,元素 1
出现了1次,元素 2
出现了1次,元素 3
出现了2次,元素 4
出现了3次,元素 5
出现了1次。
pandas
库中的 value_counts()
方法返回 Series 中每个元素出现的数量。它通常用于对数据进行初步探索和分析。
import pandas as pd
arr = np.array([1, 2, 3, 3, 4, 4, 4, 5])
series = pd.Series(arr)
print(series.value_counts())
输出结果:
4 3
3 2
2 1
5 1
1 1
dtype: int64
以上结果表示 arr
数组中,元素 1
出现了1次,元素 2
出现了1次,元素 3
出现了2次,元素 4
出现了3次,元素 5
出现了1次。
无论是使用 numpy
的 unique()
方法还是 pandas
的 value_counts()
方法,都可以进行数组中元素的值计数。其中,numpy
库更为底层,提供了更丰富的功能,而 pandas
库则更为高层,针对数据分析提供更加便捷的操作方式。