📅  最后修改于: 2023-12-03 15:33:24.262000             🧑  作者: Mango
在使用 Pandas 处理数据时,可能会遇到需要将 DataFrame 中某一列中值为 null 的行进行删除的情况。本文将介绍如何使用 Pandas 删除列中为 null 的行。
使用 dropna()
函数可以删除 DataFrame 中含有 null 值的行。我们可以通过指定 how
参数来删除含有 null 值的列,例如:
import pandas as pd
# 创建包含 null 值的 DataFrame
data = {'Name': ['Tom', 'Jerry', None, 'Bob'], 'Age': [20, 30, None, 40], 'Gender':['M', 'F', 'M', None]}
df = pd.DataFrame(data)
# 使用 dropna() 删除 'Name' 列中含有 null 的行
df.dropna(subset=['Name'], inplace=True)
print(df)
输出:
Name Age Gender
0 Tom 20.0 M
1 Jerry 30.0 F
3 Bob 40.0 None
在这个例子中,我们使用 dropna()
函数删除了 'Name' 列中含有 null 的行。参数 subset
指定了要删除的列。
如果我们不指定 subset
,那么该函数将对整个 DataFrame 进行处理:
# 删除整个 DataFrame 中含有 null 值的行
df.dropna(inplace=True)
print(df)
输出:
Name Age Gender
0 Tom 20.0 M
1 Jerry 30.0 F
如果我们想知道 DataFrame 中含有多少个 null 值,可以使用 isnull()
函数将 null 值转换成 True,然后使用 sum()
函数进行统计:
# 统计 DataFrame 中 null 值的数量
print(df.isnull().sum())
输出:
Name 0
Age 0
Gender 0
dtype: int64
使用 Pandas 的 dropna()
函数可以方便地删除 DataFrame 中列中含有 null 值的行。同时,使用 isnull()
和 sum()
函数可以统计 DataFrame 中 null 值的数量。