📅  最后修改于: 2023-12-03 14:46:31.123000             🧑  作者: Mango
isin()
函数是Python中pandas库中DataFrame和Series对象的方法,用于检查对象中的每个元素是否包含在给定的序列中。该函数返回一个布尔值的DataFrame或Series对象,如果传递的对象包含在序列中,则返回True,否则返回False。
DataFrame.isin(self, values)
Series.isin(self, values)
参数:
values: 一个列表或DataFrame / Series对象,包含要匹配的值。
返回值:
DataFrame或Series对象,其中True表示对象包含在序列中,False表示对象不包含在序列中。
import pandas as pd
# 创建DataFrame
df = pd.DataFrame({'A': ['foo', 'bar', 'baz', 'qux'], 'B': [1, 2, 3, 4], 'C': [True, False, True, False]})
# 使用.isin()函数过滤“foo”和“baz”
df[df['A'].isin(['foo', 'baz'])]
# 输出
# A B C
# 0 foo 1 True
# 2 baz 3 True
上面的示例中,使用df['A'].isin(['foo', 'baz'])
过滤了DataFrame中“A”列值为“foo”和“baz”的行,并返回一个布尔值的DataFrame对象。再将该对象传递到df[]
中,以返回包含过滤结果的DataFrame对象。
在数据清理和数据处理中,isin()
函数非常有用。 它可以用于过滤包含一组关键字的文本数据,例如在给定的DataFrame中搜索包含特定字母组合的电子邮件地址,或在指定的数据范围内搜索最佳匹配项等等。