📅  最后修改于: 2023-12-03 15:24:20.683000             🧑  作者: Mango
在 R 中,is.na
函数可用于检查变量是否为缺失值(NA)。
快速了解缺失值可以参考我的文章 R中的缺失值。
使用 is.na
函数可以检查单个变量是否为缺失值。例如:
x <- c(1, NA, 3)
is.na(x)
执行结果如下:
[1] FALSE TRUE FALSE
这个结果告诉我们,x
中的第二个元素是缺失值。
对于矩阵/数据框中的缺失值,可以直接使用 is.na
函数。例如:
df <- data.frame(a = c(1, 2, NA), b = c(4, NA, 6))
is.na(df)
执行结果如下:
a b
[1,] FALSE FALSE
[2,] FALSE TRUE
[3,] TRUE FALSE
这个结果告诉我们,df
中的第二行第二列、第三行第一列都是缺失值。
我们可以使用 sum
函数结合 is.na
函数来统计一个向量中缺失值的个数。例如:
x <- c(1, NA, 3)
sum(is.na(x))
执行结果为:
[1] 1
这个结果告诉我们,x
中有一个缺失值。
对于矩阵/数据框,可以使用 apply
函数在每一列或者每一行上面累加缺失值。例如:
df <- data.frame(a = c(1, 2, NA), b = c(4, NA, 6))
apply(df, 2, function(x) sum(is.na(x)))
执行结果为:
a b
1 1
这个结果告诉我们,df
中 a
、b
列都有1个缺失值。
is.na
函数在 R 中使用非常简单,可以帮助我们快速地检查变量或者矩阵/数据框中的缺失值,以便我们进行数据清洗、数据分析等工作。