📜  Python| Pandas Index.duplicated()(1)

📅  最后修改于: 2023-12-03 14:46:22.683000             🧑  作者: Mango

Python | Pandas Index.duplicated()

Index.duplicated()是pandas库中的一个函数,用于返回一个布尔型数组。它指示每个元素是否是在先前出现的元素中的一个副本,即是否是一个重复的元素。

语法
Index.duplicated(keep='first')
参数
  • keep: {'first', 'last', False}, 默认为 'first'。如果是 'first',则重复原始,前面的标记为 True。如果是 'last',则所有相同元素中的最后一个标记为 True。如果是False,则所有重复项都标记为 True。
返回值

返回一个布尔类型的数组,表示数组中的每个元素是否是在先前出现的元素中的一个副本。

示例

示例1:使用keep='first'

import pandas as pd

index = pd.Index([1, 2, 2, 3, 4, 4, 4, 5])
duplicated = index.duplicated(keep='first')
print(duplicated)

输出:

[False False  True False False  True  True False]

示例2:使用keep='last'

import pandas as pd

index = pd.Index([1, 2, 2, 3, 4, 4, 4, 5])
duplicated = index.duplicated(keep='last')
print(duplicated)

输出:

[False  True False False  True  True False False]

示例3:使用keep=False

import pandas as pd

index = pd.Index([1, 2, 2, 3, 4, 4, 4, 5])
duplicated = index.duplicated(keep=False)
print(duplicated)

输出:

[False  True  True False  True  True  True False]

以上示例中,输入的索引是 [1, 2, 2, 3, 4, 4, 4, 5],其中有重复的元素。通过 duplicated() 函数可以得到一个结果,其中 True 表示该元素是一个重复的元素,False 表示该元素不是重复的。

总结

使用 Index.duplicated() 函数可以快速地判断一个索引对象是否有重复的元素,并返回一个布尔类型的数组。通过设置不同的 keep 参数,可以得到不同的输出结果。