📌  相关文章
📜  如何检查 R 数据框中的缺失值?

📅  最后修改于: 2022-05-13 01:55:43.386000             🧑  作者: Mango

如何检查 R 数据框中的缺失值?

在本文中,我们将看到如何在 R 编程语言中找出数据框中的缺失值。

方法:

第 1 步:创建 DataFrame。

让我们首先创建一个包含一些缺失值的数据框,然后通过一个示例演示如何找到缺失值。

R
data <- data.frame(x1 = c(NA, 5, 6, 8, 9),   
                        x2 = c(2, 4, NA, NA, 1), 
                        x3 = c(3,6,7,0,3), 
                        x4 = c("Hello", "value",
                               NA, "geeksforgeeks", NA)) 
                                                                             
display(data)


R
data <- data.frame(x1 = c(NA, 5, 6, 8, 9),       
                        x2 = c(2, 4, NA, NA, 1), 
                        x3 = c(3,6,7,0,3), 
                        x4 = c("Hello", "value",
                               NA, "geeksforgeeks", NA)) 
                                                                             
data                    
  
# to find out the missing value
which(is.na(data$x1))
which(is.na(data$x2)) 
which(is.na(data$x3)) 
which(is.na(data$x4))


R
Name <- c("John", "Sunny", NA)
Age <- c(31, 18, NA)
number<- c("0", "1", "2")
  
data <- data.frame(Name, Sex, number)
  
display(data)


R
Name <- c("John", "Sunny", NA)
Age <- c(31, 18, NA)
number<- c("0", "1", "2")
  
data <- data.frame(Name, Sex, number)
sum(is.na(data))


输出:



我们创建了一个带有一些缺失值 (NA) 的数据框。

第 2 步:现在检查我们在 R 中使用 is.na()函数的缺失值并打印出数据框中缺失项的数量,如下所示。

示例 1:

在这个例子中,我们首先创建了一些缺失值的数据,然后使用上述函数分别在特定列 x1、×2、x3 和 x4 中找到缺失值。

电阻



data <- data.frame(x1 = c(NA, 5, 6, 8, 9),       
                        x2 = c(2, 4, NA, NA, 1), 
                        x3 = c(3,6,7,0,3), 
                        x4 = c("Hello", "value",
                               NA, "geeksforgeeks", NA)) 
                                                                             
data                    
  
# to find out the missing value
which(is.na(data$x1))
which(is.na(data$x2)) 
which(is.na(data$x3)) 
which(is.na(data$x4))

输出:

打印有缺失值的变量和缺失值的数量。

示例 2:

让我们使用不同的方法找到缺失值的数量,在此示例中,我们创建了具有缺失值的数据,然后找到数据中缺失值的数量。

电阻

Name <- c("John", "Sunny", NA)
Age <- c(31, 18, NA)
number<- c("0", "1", "2")
  
data <- data.frame(Name, Sex, number)
  
display(data)

输出:

我们有一个数据框,我们必须找到这个数据框中缺失值的数量。

电阻

Name <- c("John", "Sunny", NA)
Age <- c(31, 18, NA)
number<- c("0", "1", "2")
  
data <- data.frame(Name, Sex, number)
sum(is.na(data))

输出: