📅  最后修改于: 2023-12-03 14:51:03.784000             🧑  作者: Mango
在数据分析过程中,经常需要检查数据集中是否有缺失值。在 Pandas 中,我们可以使用 .isnull()
方法来检查数据集中的缺失值。该方法将返回一个布尔类型的 DataFrame,其中 True 表示该位置存在缺失值。
以下是一个示例代码片段,演示了如何按列检查缺失值:
import pandas as pd
# 创建示例数据集
data = {'Name': ['Tom', 'John', 'Sarah', 'Rose', 'Tina'],
'Age': [28, 19, 25, np.nan, 21],
'City': ['Beijing', 'New York', np.nan, 'London', 'Tokyo'],
'Salary': [3000, 2500, 5000, np.nan, 4000]}
df = pd.DataFrame(data)
# 检查缺失值
null_values = df.isnull().sum()
print(null_values)
输出结果如下:
Name 0
Age 1
City 1
Salary 1
dtype: int64
上面的代码中,我们首先创建了一个示例数据集,并命名为 df
。然后使用 .isnull()
方法检查了数据集中的缺失值,将结果存储在 null_values
变量中。最后,我们打印了 null_values
变量,以显示每列中的缺失值数量。
Markdown 版本的代码片段如下:
# 在 pandas 中按列检查缺失值 - Python
在数据分析过程中,经常需要检查数据集中是否有缺失值。在 Pandas 中,我们可以使用 `.isnull()` 方法来检查数据集中的缺失值。该方法将返回一个布尔类型的 DataFrame,其中 True 表示该位置存在缺失值。
以下是一个示例代码片段,演示了如何按列检查缺失值:
```python
import pandas as pd
# 创建示例数据集
data = {'Name': ['Tom', 'John', 'Sarah', 'Rose', 'Tina'],
'Age': [28, 19, 25, np.nan, 21],
'City': ['Beijing', 'New York', np.nan, 'London', 'Tokyo'],
'Salary': [3000, 2500, 5000, np.nan, 4000]}
df = pd.DataFrame(data)
# 检查缺失值
null_values = df.isnull().sum()
print(null_values)
输出结果如下:
Name 0
Age 1
City 1
Salary 1
dtype: int64
上面的代码中,我们首先创建了一个示例数据集,并命名为 df
。然后使用 .isnull()
方法检查了数据集中的缺失值,将结果存储在 null_values
变量中。最后,我们打印了 null_values
变量,以显示每列中的缺失值数量。