📅  最后修改于: 2023-12-03 14:46:22.683000             🧑  作者: Mango
Index.duplicated()
是pandas库中的一个函数,用于返回一个布尔型数组。它指示每个元素是否是在先前出现的元素中的一个副本,即是否是一个重复的元素。
Index.duplicated(keep='first')
keep
: {'first', 'last', False}, 默认为 'first'。如果是 'first',则重复原始,前面的标记为 True。如果是 'last',则所有相同元素中的最后一个标记为 True。如果是False,则所有重复项都标记为 True。返回一个布尔类型的数组,表示数组中的每个元素是否是在先前出现的元素中的一个副本。
示例1:使用keep='first'
import pandas as pd
index = pd.Index([1, 2, 2, 3, 4, 4, 4, 5])
duplicated = index.duplicated(keep='first')
print(duplicated)
输出:
[False False True False False True True False]
示例2:使用keep='last'
import pandas as pd
index = pd.Index([1, 2, 2, 3, 4, 4, 4, 5])
duplicated = index.duplicated(keep='last')
print(duplicated)
输出:
[False True False False True True False False]
示例3:使用keep=False
import pandas as pd
index = pd.Index([1, 2, 2, 3, 4, 4, 4, 5])
duplicated = index.duplicated(keep=False)
print(duplicated)
输出:
[False True True False True True True False]
以上示例中,输入的索引是 [1, 2, 2, 3, 4, 4, 4, 5]
,其中有重复的元素。通过 duplicated()
函数可以得到一个结果,其中 True
表示该元素是一个重复的元素,False
表示该元素不是重复的。
使用 Index.duplicated()
函数可以快速地判断一个索引对象是否有重复的元素,并返回一个布尔类型的数组。通过设置不同的 keep
参数,可以得到不同的输出结果。