📜  如何在 R 中使用 is.na?(1)

📅  最后修改于: 2023-12-03 15:24:20.683000             🧑  作者: Mango

在 R 中使用 is.na

简介

在 R 中,is.na 函数可用于检查变量是否为缺失值(NA)。

快速了解缺失值可以参考我的文章 R中的缺失值

用法
检查单个变量

使用 is.na 函数可以检查单个变量是否为缺失值。例如:

x <- c(1, NA, 3)
is.na(x)

执行结果如下:

[1] FALSE  TRUE FALSE

这个结果告诉我们,x 中的第二个元素是缺失值。

检查矩阵/数据框中的缺失值

对于矩阵/数据框中的缺失值,可以直接使用 is.na 函数。例如:

df <- data.frame(a = c(1, 2, NA), b = c(4, NA, 6))
is.na(df)

执行结果如下:

       a     b
[1,] FALSE FALSE
[2,] FALSE  TRUE
[3,]  TRUE FALSE

这个结果告诉我们,df 中的第二行第二列、第三行第一列都是缺失值。

判断缺失值个数

我们可以使用 sum 函数结合 is.na 函数来统计一个向量中缺失值的个数。例如:

x <- c(1, NA, 3)
sum(is.na(x))

执行结果为:

[1] 1

这个结果告诉我们,x 中有一个缺失值。

对于矩阵/数据框,可以使用 apply 函数在每一列或者每一行上面累加缺失值。例如:

df <- data.frame(a = c(1, 2, NA), b = c(4, NA, 6))
apply(df, 2, function(x) sum(is.na(x)))

执行结果为:

a b 
1 1

这个结果告诉我们,dfab 列都有1个缺失值。

总结

is.na 函数在 R 中使用非常简单,可以帮助我们快速地检查变量或者矩阵/数据框中的缺失值,以便我们进行数据清洗、数据分析等工作。