📅  最后修改于: 2023-12-03 15:24:36.207000             🧑  作者: Mango
在数据分析中,缺失值是常见的问题之一。在R中,我们可以使用is.na()
函数来检测缺失值。本文将介绍如何在R中的数据框中找到缺失值的百分比。
我们将使用以下数据框来演示:
df <- data.frame(
A = c(NA, 2, 3, 4, 5),
B = c("a", "b", NA, "d", "e"),
C = c(1.3, NA, 3.7, NA, 5.2)
)
该数据框包含3列和5行数据,包括缺失值。
我们可以使用以下代码来找到数据框中每一列中的缺失值的百分比:
sapply(df, function(x) sum(is.na(x))/length(x))
输出:
A B C
0.2000 0.2000 0.4000
以上代码内部使用sapply()
函数对每一列应用一个函数,该函数可以计算每一列中缺失值的百分比。此函数使用is.na()
函数检查每个元素是否为缺失值,使用sum()
函数计算缺失值的数量,并使用length()
函数获取列中元素的总数。最终,我们将每个列的缺失值百分比输出。
现在,您已经知道如何在R中的数据框中找到缺失值的百分比。我们建议在每个数据框上面使用此代码,以了解数据质量的情况并确定是否需要进行数据清洗。