计算 R 中重复的数量

在本文中，我们将看到如何在 R 编程语言中找出重复的数量。

可以通过两种方法完成：

使用duplicated()函数。
使用算法。

方法一：使用duplicated()

R和dplyr功能在这里，我们将使用复制（）函数。

方法：

将“library(tidyverse)”包插入到程序中。
创建数据框或向量。
使用duplicated()函数并检查重复数据。

Syntax: duplicated(x)

Parameters: x: Data frame or a vector

编程需要懂一点英语

示例 1：在向量中查找重复项。

让我们首先创建一个向量并找到 x 中重复元素的位置。

R

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)

R

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)
x[duplicated(x)]

R

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle",
               "Ryan","Gary","x" , "y"))
  
display(data)

R

duplicated(data$emp_id)

R

data <- data.frame(
  emp_id = c (1, 1, 2, 4, 5, 6, 6),  
  emp_name = c("Rick", "Dan", "Michelle",
               "Ryan", "Gary", "x" , "y"))
  
duplicated[(data$emp_id), ]

R

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle","Ryan","Gary","x" , "y"))
  
sum(table(data$emp_id)-1)

提取 x 中的重复元素。

电阻

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)
x[duplicated(x)]

在这里我们可以看到所有重复的元素。

示例 2：在 Dataframe 中查找重复项。

现在让我们创建一个数据框。

电阻

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle",
               "Ryan","Gary","x" , "y"))
  
display(data)

这里我们有一个数据框，有些项目是重复的，所以我们必须在这个数据框中找到重复的元素。

我们将检查哪一列有重复的数据。

电阻

duplicated(data$emp_id)

所以现在在emp_id列中找出有多少重复元素。

电阻

data <- data.frame(
  emp_id = c (1, 1, 2, 4, 5, 6, 6),  
  emp_name = c("Rick", "Dan", "Michelle",
               "Ryan", "Gary", "x" , "y"))
  
duplicated[(data$emp_id), ]

我们可以在emp_id列中看到所有重复的元素。

方法二：使用算法。

让我们假设我们有一个包含重复数据的数据框，我们必须找出该数据框中的重复数。

电阻

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle","Ryan","Gary","x" , "y"))
  
sum(table(data$emp_id)-1)

输出：

我们可以清楚地看到我们已经计算了数据框中的重复次数。