📅  最后修改于: 2023-12-03 15:38:22.433000             🧑  作者: Mango
在使用 pandas 进行数据处理和分析时,经常需要查询数据集中存在的缺失值(NaN)。本文将介绍如何使用 pandas 查找数据集中的 NaN 值的总数。
使用 pandas 的 isnull 函数可以找到数据集中的 NaN 值。该函数会返回一个由 True 和 False 组成的布尔型 DataFrame,其中 NaN 值对应的位置为 True。对这个 DataFrame 进行求和操作即可得到 NaN 值的总数。以下是示例代码:
import pandas as pd
data = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8]})
nan_count = data.isnull().sum().sum()
print(nan_count)
输出:
2
在上面的代码中,我们首先创建一个包含 NaN 值的 DataFrame,然后使用 isnull 函数找到 NaN 值对应的位置,并返回一个由 True 和 False 组成的 DataFrame。最后使用 sum 函数对 DataFrame 进行求和,得到 NaN 值的总数。在本例中,DataFrame 中共有 2 个 NaN 值。
另外一种查找数据集中,NaN 值的方式是使用 numpy 库的 isnan 函数。该函数会返回一个由 True 和 False 组成的布尔型数组,其中 NaN 值对应的位置为 True。对这个数组进行求和操作即可得到 NaN 值的总数。
以下是示例代码:
import numpy as np
import pandas as pd
data = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8]})
nan_count = np.isnan(data).sum()
print(nan_count)
输出:
2
在上面的代码中,我们首先创建一个包含 NaN 值的 DataFrame,然后使用 numpy 库的 isnan 函数找到 NaN 值对应的位置,并返回一个由 True 和 False 组成的布尔型数组。最后使用 sum 函数对数组进行求和,得到 NaN 值的总数。在本例中,DataFrame 中共有 2 个 NaN 值。
在本文中,我们介绍了两种使用 pandas 查找数据集中 NaN 值的方法,分别是 isnull 函数和 numpy 库的 isnan 函数。这些方法可以帮助我们更好地处理和分析数据集中的缺失值。