📌  相关文章
📜  如何检查 R 数据框中的缺失值?(1)

📅  最后修改于: 2023-12-03 15:09:11.443000             🧑  作者: Mango

如何检查 R 数据框中的缺失值?

在使用 R 进行数据分析时,经常会遇到数据缺失的情况,因此需要对数据框中的缺失值进行检查。本文将介绍如何在 R 中检查数据框中的缺失值。

检查缺失值

在 R 中,我们通常使用 is.na() 函数来检查缺失值。该函数可以用于向量、矩阵和数据框。

检查向量中的缺失值

我们首先来看如何检查向量中的缺失值。假设有一个向量 x,我们可以使用以下代码来检查其中是否有缺失值:

x <- c(1, NA, 3, NA, 5)
is.na(x)

执行上述代码后,输出结果如下:

[1] FALSE  TRUE FALSE  TRUE FALSE

可以看到,is.na() 函数返回了一个逻辑向量,其中 TRUE 表示对应元素是缺失值,FALSE 表示对应元素不是缺失值。

检查数据框中的缺失值

对于数据框,我们可以使用 apply() 函数来对每列进行操作。假设有一个数据框 df,我们可以使用以下代码来检查其中的缺失值:

df <- data.frame(x = c(1, 2, NA, 4, 5),
                 y = c("a", "b", NA, "d", "e"),
                 z = c(NA, 2, 3, NA, 5))
apply(df, 2, function(x) sum(is.na(x)))

执行上述代码后,输出结果如下:

x y z 
1 1 2 

可以看到,我们对数据框 df 中的每列使用了 is.na() 函数,然后使用 sum() 函数统计了每列中缺失值的数量。

用可视化的方法检查缺失值

除了使用代码来检查缺失值外,我们还可以使用可视化的方法来检查缺失值。在 R 中,可以使用 vis_miss() 函数来绘制缺失值的可视化图表。

绘制单个变量的缺失值图表

假设有一个向量 x,我们可以使用以下代码来绘制该向量的缺失值图表:

library(naniar)
x <- c(1, NA, 3, NA, 5)
vis_miss(x)

执行上述代码后,会弹出一个图表窗口,显示 x 向量中的缺失值情况。

绘制数据框中所有变量的缺失值图表

假设有一个数据框 df,我们可以使用以下代码来绘制该数据框中所有变量的缺失值图表:

library(naniar)
df <- data.frame(x = c(1, 2, NA, 4, 5),
                 y = c("a", "b", NA, "d", "e"),
                 z = c(NA, 2, 3, NA, 5))
vis_miss(df)

执行上述代码后,会弹出一个图表窗口,显示 df 数据框中所有变量的缺失值情况。

总结

本文介绍了如何在 R 中检查数据框中的缺失值。我们可以使用 is.na() 函数来检查向量和数据框中的缺失值,还可以使用 vis_miss() 函数来用可视化的方式检查缺失值。