📜  获取缺少列的行 pandas - Python (1)

📅  最后修改于: 2023-12-03 14:57:17.272000             🧑  作者: Mango

获取缺少列的行 Pandas - Python

有时候我们需要在一个数据集中找到缺失某些列的行,Pandas提供了一些简单的方法来实现这个目标。在本节中,我们将介绍如何使用Pandas来获取缺少列的行。

1. 创建示例数据集

我们先创建一个示例数据集,其中包含一些缺少列的行。

import pandas as pd

# 创建示例数据集
data = {'Name': ['Tom', 'Kate', 'Alice', 'Sam'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'Paris', 'London', 'Tokyo']}
df = pd.DataFrame(data)

# 添加缺失列的行
df.loc[4] = ['Bob', None, 'Sydney']
df.loc[5] = ['Lily', 28, None]
df.loc[6] = [None, 33, 'Berlin']

print(df)

输出结果为:

    Name   Age       City
0    Tom  25.0   New York
1   Kate  30.0      Paris
2  Alice  35.0     London
3    Sam  40.0      Tokyo
4    Bob   NaN     Sydney
5   Lily  28.0       None
6   None  33.0     Berlin

可以看到,在数据集中添加了三行,分别缺少了不同的列。

2. 获取缺少列的行

我们可以使用isnull()函数来检测数据集中缺失的值,然后将返回的布尔数组传递给df.any(axis=1)函数,以获得缺少列的行。

# 获取缺少列的行
missing_cols = ['Name', 'Age', 'City']
missing_rows = df[df[missing_cols].isnull().any(axis=1)]
print(missing_rows)

输出结果为:

   Name   Age    City
4   Bob   NaN  Sydney
5  Lily  28.0    None
6  None  33.0  Berlin

我们得到了缺少列的行。可以看到,第4行缺少“Age”列,第5行缺少“City”列,第6行缺少“Name”列。

3. 总结

在本节中,我们介绍了如何使用Pandas来获取缺少列的行。我们首先创建了一个示例数据集,其中包含了一些缺少列的行。然后,我们使用isnull()和any()函数来查找缺少列的行。