📅  最后修改于: 2023-12-03 15:33:24.330000             🧑  作者: Mango
在数据清洗的过程中,我们经常需要删除具有 null 值的行。Pandas 提供了一种简单的方法来删除具有 null 值的行,即使用 .dropna() 方法。
import pandas as pd
# 创建一个包含 null 值的 DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, 6, 7, None]})
# 查看数据集
print(df)
# 使用 .dropna() 方法删除具有 null 值的行
df = df.dropna(subset=['B'])
# 查看删除 null 值后的数据集
print(df)
输出结果如下:
A B
0 1.0 5.0
1 2.0 6.0
2 NaN 7.0
3 4.0 NaN
A B
0 1.0 5.0
1 2.0 6.0
2 NaN 7.0
可以看到,我们使用 .dropna() 方法删除了具有 null 值的行,并生成了一个新的 DataFrame。其中,参数 subset 表示要删除哪些列中具有 null 值的行。
同时,我们也可以使用 .isnull() 方法来查找具有 null 值的行:
import pandas as pd
# 创建一个包含 null 值的 DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, 6, 7, None]})
# 查找具有 null 值的行
null_rows = df[df.isnull().any(axis=1)]
# 查看具有 null 值的行
print(null_rows)
输出结果如下:
A B
2 NaN 7.0
3 4.0 NaN
可以看到,我们使用 .isnull() 方法先查找具有 null 值的行,再使用 .any() 方法判断哪些行具有 null 值,最后生成一个新的 DataFrame。其中,参数 axis=1 表示按行查找。