📅  最后修改于: 2023-12-03 14:57:26.965000             🧑  作者: Mango
在Python中,我们有多种方法来计算一个集合的唯一值。这些方法包括使用set()函数、使用numpy.unique()函数、使用Pandas库的drop_duplicates()函数等。
在本文中,我们将逐一介绍这些方法的用法,并给出相关的代码片段。
Python中的set()函数可用于从一个列表或元组中获取唯一的值。
my_list = [1, 2, 3, 2, 4, 3, 5, 1]
unique_values = set(my_list)
print(unique_values)
输出结果如下:
{1, 2, 3, 4, 5}
numpy库的unique()函数可以用于在数组中查找唯一值。
import numpy as np
my_array = np.array([1, 2, 3, 2, 4, 3, 5, 1])
unique_values = np.unique(my_array)
print(unique_values)
输出结果如下:
[1 2 3 4 5]
Pandas库中的drop_duplicates()函数可用于从DataFrame中查找唯一值。
import pandas as pd
my_df = pd.DataFrame({'col1': [1, 2, 3, 2, 4, 3, 5, 1], 'col2': [4, 5, 6, 7, 8, 9, 10, 11]})
unique_values = my_df.drop_duplicates(subset=['col1'])
print(unique_values)
输出结果如下:
col1 col2
0 1 4
1 2 5
2 3 6
4 4 8
6 5 10
在上面的代码片段中,我们使用了DataFrame的drop_duplicates()函数来查找唯一的值。该函数允许我们指定要用于查找唯一值的列。在上面的实例中,我们指定了“col1”作为唯一值的基准列。
本文介绍了Python中计算唯一值的三种方法。这些方法分别是使用set()函数、使用numpy库的unique()函数和使用Pandas库的drop_duplicates()函数。
在实际应用中,你可以根据自己的需求来选择其中的一种或多种方法。无论哪种方法,切记要根据具体情况来考虑其效率和适用性。