📅  最后修改于: 2023-12-03 14:57:17.272000             🧑  作者: Mango
有时候我们需要在一个数据集中找到缺失某些列的行,Pandas提供了一些简单的方法来实现这个目标。在本节中,我们将介绍如何使用Pandas来获取缺少列的行。
我们先创建一个示例数据集,其中包含一些缺少列的行。
import pandas as pd
# 创建示例数据集
data = {'Name': ['Tom', 'Kate', 'Alice', 'Sam'],
'Age': [25, 30, 35, 40],
'City': ['New York', 'Paris', 'London', 'Tokyo']}
df = pd.DataFrame(data)
# 添加缺失列的行
df.loc[4] = ['Bob', None, 'Sydney']
df.loc[5] = ['Lily', 28, None]
df.loc[6] = [None, 33, 'Berlin']
print(df)
输出结果为:
Name Age City
0 Tom 25.0 New York
1 Kate 30.0 Paris
2 Alice 35.0 London
3 Sam 40.0 Tokyo
4 Bob NaN Sydney
5 Lily 28.0 None
6 None 33.0 Berlin
可以看到,在数据集中添加了三行,分别缺少了不同的列。
我们可以使用isnull()函数来检测数据集中缺失的值,然后将返回的布尔数组传递给df.any(axis=1)函数,以获得缺少列的行。
# 获取缺少列的行
missing_cols = ['Name', 'Age', 'City']
missing_rows = df[df[missing_cols].isnull().any(axis=1)]
print(missing_rows)
输出结果为:
Name Age City
4 Bob NaN Sydney
5 Lily 28.0 None
6 None 33.0 Berlin
我们得到了缺少列的行。可以看到,第4行缺少“Age”列,第5行缺少“City”列,第6行缺少“Name”列。
在本节中,我们介绍了如何使用Pandas来获取缺少列的行。我们首先创建了一个示例数据集,其中包含了一些缺少列的行。然后,我们使用isnull()和any()函数来查找缺少列的行。