在 R 中导入和合并多个 CSV 文件
在本文中,我们将研究在 R 编程语言中合并多个 CSV 文件的方法。
使用的模块
- dplyr:这是一种数据操作结构,提供一组统一的动词,帮助解决最常见的数据操作障碍。
- plyr: plyr 是一个 R 包,它使拆分数据变得简单,对它做一些事情,然后把它混在一起。
- readr:这提供了一种读取矩形数据(如“csv”、“tsv”和“fwf”)的快速而友好的方式。
使用的功能
- list.files()函数:此函数生成指定目录中文件或目录名称的字符向量。
Syntax: list.files(path = “.”, pattern = NULL, all.files = FALSE,full.names = FALSE, recursive = FALSE, ignore.case = FALSE, include.dirs = FALSE, no.. = FALSE)
- lapply()函数:该函数返回一个与 X 长度相同的列表,其中的每个元素都是对 X 的对应元素应用 FUN 的结果。
Syntax: lapply(X, FUN, …)
- bind_rows()函数:该函数是 do.call(rbind, dfs) 或 do.call(cbind, dfs) 的常见模式的一种有效实现,用于将多个数据帧绑定为一个。
Syntax:
bind_rows(…, .id = NULL)
Parameter:
…: Data frames to combine.
.id: Data frame identifier.
要合并多个 CSV 文件,用户需要在 R 控制台中安装并导入 dplyr、plyr 和 readr 包,以调用这些包中的 list.files()、lapply() 和 bind_rows() 函数并传递这些函数需要的参数将给定的多个 CSV 文件合并到 R 编程语言中的单个数据框。
使用中的数据:
例子:
R
library("dplyr")
library("plyr")
library("readr")
gfg_data <- list.files(path = "C:/Users/Geetansh Sahni/Documents/R/Data",
pattern = "*.csv", full.names = TRUE) %>%
lapply(read_csv) %>%
bind_rows
gfg_data
输出: