📅  最后修改于: 2023-12-03 14:46:30.982000             🧑  作者: Mango
.dropna()
是熊猫系列中用于删除缺失值的函数。
缺失值是指数据表中空白、NaN 或者 None 等数值上的缺失。
.dropna()
通过指定参数来控制数据表的缺失值删除行为。此函数可以删除含有缺失值的行或者列。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, None, 35], 'gender': ['F', 'M', None]}) # 生成一个数据表,含有缺失值
df = df.dropna() # 删除含有缺失值的行
print(df)
返回结果:
name age gender
0 Alice 25.0 F
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, None, 35], 'gender': ['F', 'M', None]}) # 生成一个数据表,含有缺失值
df = df.dropna(axis=1) # 删除含有缺失值的列
print(df)
返回结果:
name
0 Alice
1 Bob
2 Charlie
axis
:可选参数,默认值为 0,可以取 0 或者 1。0 表示按行处理缺失值,1 表示按列处理缺失值。
how
:可选参数,表示在某个方向检测到缺失值的个数是否满足设定的数量。可选值为{'any', 'all'}。
thresh
:可选参数,表示在指定方向上非缺失值的最小数量。
subset
:可选参数,用于指定删除缺失值时的依据。
以上示例都是简单的用法,更多用法可以参考官方文档:pandas.DataFrame.dropna。