📅  最后修改于: 2023-12-03 15:19:22.010000             🧑  作者: Mango
.where()
是Pandas库中的一个函数,主要用于从DataFrame中减少原有数据集中的数据量。这个函数只需要指定一个条件,就可以得到符合条件的数据集。
语法:DataFrame.where(cond, other=nan, inplace=False, axis=None, level=None, errors='raise', try_cast=False)
cond
:所需筛选数据的条件;other
:不符合条件的值将被赋予该值,默认为NaN;inplace
:是否直接在原DataFrame中操作;axis
:计算的方向,0为行,1为列,默认为无;level
:需要筛选的axis在多重索引上用的级别,默认为无;errors
:设定出现错误时的处理方式,默认为raise;try_cast
:是否进行强制类型转化,如果出现内存溢出,建议设置为False。import pandas as pd
import numpy as np
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': ['a', 'b', 'c', 'd', 'e']})
df.where(df > 3, -df)
A B C
0 -1.0 -6.0 -a
1 -2.0 -7.0 -b
2 -3.0 -8.0 -c
3 4.0 9.0 d
4 5.0 10.0 e
.where()
函数的使用非常简单,可以帮助我们轻松地完成数据筛选的功能。但需要注意的是,由于这个函数只是减少原有数据集中的数据量,因此不能帮我们改变数据类型等问题,所以在使用时需要谨慎。