📌  相关文章
📜  pandas 删除列中为 null 的行 - Python (1)

📅  最后修改于: 2023-12-03 15:33:24.262000             🧑  作者: Mango

Pandas 删除列中为null的行 - Python

在使用 Pandas 处理数据时,可能会遇到需要将 DataFrame 中某一列中值为 null 的行进行删除的情况。本文将介绍如何使用 Pandas 删除列中为 null 的行。

删除列中为 null 的行

使用 dropna() 函数可以删除 DataFrame 中含有 null 值的行。我们可以通过指定 how 参数来删除含有 null 值的列,例如:

import pandas as pd

# 创建包含 null 值的 DataFrame
data = {'Name': ['Tom', 'Jerry', None, 'Bob'], 'Age': [20, 30, None, 40], 'Gender':['M', 'F', 'M', None]}
df = pd.DataFrame(data)

# 使用 dropna() 删除 'Name' 列中含有 null 的行
df.dropna(subset=['Name'], inplace=True)

print(df)

输出:

    Name   Age Gender
0    Tom  20.0      M
1  Jerry  30.0      F
3    Bob  40.0   None

在这个例子中,我们使用 dropna() 函数删除了 'Name' 列中含有 null 的行。参数 subset 指定了要删除的列。

如果我们不指定 subset,那么该函数将对整个 DataFrame 进行处理:

# 删除整个 DataFrame 中含有 null 值的行
df.dropna(inplace=True)

print(df)

输出:

    Name   Age Gender
0    Tom  20.0      M
1  Jerry  30.0      F
统计 DataFrame 中 null 值的数量

如果我们想知道 DataFrame 中含有多少个 null 值,可以使用 isnull() 函数将 null 值转换成 True,然后使用 sum() 函数进行统计:

# 统计 DataFrame 中 null 值的数量
print(df.isnull().sum())

输出:

Name      0
Age       0
Gender    0
dtype: int64
结论

使用 Pandas 的 dropna() 函数可以方便地删除 DataFrame 中列中含有 null 值的行。同时,使用 isnull()sum() 函数可以统计 DataFrame 中 null 值的数量。