📌  相关文章
📜  pandas 在特定列中删除具有 null 的行 - Python (1)

📅  最后修改于: 2023-12-03 15:33:24.330000             🧑  作者: Mango

Pandas 在特定列中删除具有 null 的行 - Python

在数据清洗的过程中,我们经常需要删除具有 null 值的行。Pandas 提供了一种简单的方法来删除具有 null 值的行,即使用 .dropna() 方法。

import pandas as pd

# 创建一个包含 null 值的 DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, 6, 7, None]})

# 查看数据集
print(df)

# 使用 .dropna() 方法删除具有 null 值的行
df = df.dropna(subset=['B'])

# 查看删除 null 值后的数据集
print(df)

输出结果如下:

     A    B
0  1.0  5.0
1  2.0  6.0
2  NaN  7.0
3  4.0  NaN

     A    B
0  1.0  5.0
1  2.0  6.0
2  NaN  7.0

可以看到,我们使用 .dropna() 方法删除了具有 null 值的行,并生成了一个新的 DataFrame。其中,参数 subset 表示要删除哪些列中具有 null 值的行。

同时,我们也可以使用 .isnull() 方法来查找具有 null 值的行:

import pandas as pd

# 创建一个包含 null 值的 DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, 6, 7, None]})

# 查找具有 null 值的行
null_rows = df[df.isnull().any(axis=1)]

# 查看具有 null 值的行
print(null_rows)

输出结果如下:

     A    B
2  NaN  7.0
3  4.0  NaN

可以看到,我们使用 .isnull() 方法先查找具有 null 值的行,再使用 .any() 方法判断哪些行具有 null 值,最后生成一个新的 DataFrame。其中,参数 axis=1 表示按行查找。