📜  Python|熊猫系列.dropna()(1)

📅  最后修改于: 2023-12-03 14:46:30.982000             🧑  作者: Mango

Python | 熊猫系列.dropna()

简介

.dropna() 是熊猫系列中用于删除缺失值的函数。

缺失值是指数据表中空白、NaN 或者 None 等数值上的缺失。

.dropna() 通过指定参数来控制数据表的缺失值删除行为。此函数可以删除含有缺失值的行或者列。

基本用法
删除含有缺失值的行
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, None, 35], 'gender': ['F', 'M', None]}) # 生成一个数据表,含有缺失值

df = df.dropna() # 删除含有缺失值的行

print(df)

返回结果:

      name   age gender
0    Alice  25.0      F
删除含有缺失值的列
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, None, 35], 'gender': ['F', 'M', None]}) # 生成一个数据表,含有缺失值

df = df.dropna(axis=1) # 删除含有缺失值的列

print(df)

返回结果:

     name
0   Alice
1     Bob
2  Charlie
参数介绍
  • axis:可选参数,默认值为 0,可以取 0 或者 1。0 表示按行处理缺失值,1 表示按列处理缺失值。

  • how:可选参数,表示在某个方向检测到缺失值的个数是否满足设定的数量。可选值为{'any', 'all'}。

    • 'any' 表示至少含有一个缺失值,则删除。
    • 'all' 表示所有值都是缺失值,则删除。
  • thresh:可选参数,表示在指定方向上非缺失值的最小数量。

  • subset:可选参数,用于指定删除缺失值时的依据。

更多用法

以上示例都是简单的用法,更多用法可以参考官方文档:pandas.DataFrame.dropna