Python|熊猫 Series.duplicated()
Pandas 系列是带有轴标签的一维 ndarray。标签不必是唯一的,但必须是可散列的类型。该对象支持整数和基于标签的索引,并提供了许多方法来执行涉及索引的操作。
Pandas Series.duplicated()
函数表示重复的 Series 值。重复的值在结果系列中显示为真值。可以指示所有重复项,除了第一个重复项之外的所有重复项,或者除了最后一个重复项之外的所有重复项。
Syntax: Series.duplicated(keep=’first’)
Parameter :
keep : {‘first’, ‘last’, False}, default ‘first’
Returns : pandas.core.series.Series
示例 #1:使用Series.duplicated()
函数查找给定系列对象中的重复值。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([80, 25, 3, 25, 24, 6])
# Create the Index
index_ = ['Coca Cola', 'Sprite', 'Coke', 'Fanta', 'Dew', 'ThumbsUp']
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.duplicated()
函数在给定系列对象的基础数据中查找重复值。
# detect duplicates
result = sr.duplicated()
# Print the result
print(result)
输出 :
正如我们在输出中看到的, Series.duplicated()
函数已成功检测到给定系列对象中的重复值。 False
表示对应的值是唯一的,而True
表示对应的值是给定系列对象中的重复值。示例 #2 :使用Series.duplicated()
函数查找给定系列对象中的重复值。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([11, 11, 8, 18, 65, 18, 32, 10, 5, 32, 32])
# Create the Index
index_ = pd.date_range('2010-10-09', periods = 11, freq ='M')
# set the index
sr.index = index_
# Print the series
print(sr)
输出 :
现在我们将使用Series.duplicated()
函数在给定系列对象的基础数据中查找重复值。
# detect duplicates
result = sr.duplicated()
# Print the result
print(result)
输出 :
正如我们在输出中看到的, Series.duplicated()
函数已成功检测到给定系列对象中的重复值。 False
表示对应的值是唯一的,而True
表示对应的值是给定系列对象中的重复值。