📜  如何读取 Excel 文件并选择 R 中的特定行和列?(1)

📅  最后修改于: 2023-12-03 15:38:55.407000             🧑  作者: Mango

如何读取 Excel 文件并选择 R 中的特定行和列?

对于数据分析工作,通常需要将 Excel 文件导入到 R 中进行进一步分析。在 R 中读取 Excel 文件并选择特定的行和列,可以使用 readxlopenxlsx 包。下面介绍一下这两个包的使用方法。

readxl

readxl 包提供了一个简单的函数 read_excel(),可以读取 Excel 文件并将其转换为 R 数据框。该函数允许您选择要读取的工作表、起始行和列以及要读取的列数和行数。

# 导入包
library(readxl)

# 读取 Excel 文件
data <- read_excel("文件路径.xlsx", sheet = "工作表名", col_names = TRUE,
                   skip = 1, col_types = NULL)

# 选择特定的行和列
selected_data <- data[1:10, c("col1", "col2", "col3")]
  • sheet:工作表的名称或编号,默认读取第一个工作表。
  • col_names:逻辑值,表示是否将第一行作为列名,默认为 TRUE
  • skip:要跳过的行数,默认为 0
  • col_types:列类型的向量,可以是 "text""numeric""date""logical"。默认情况下,read_excel() 会自动猜测列的类型。
openxlsx

另一个常用的 Excel 文件读取包是 openxlsx。与 readxl 包不同,openxlsx 包提供了一种更为灵活的读取 Excel 文件的方法,功能更加强大。

# 导入包
library(openxlsx)

# 读取 Excel 文件
wb <- loadWorkbook("文件路径.xlsx")
ws <- getWorksheet(wb, sheet = "工作表名")
data <- readData(ws, startRow = 2, endCol = 4, colNames = TRUE)

# 选择特定的行和列
selected_data <- data[1:10, c("col1", "col2", "col3")]
  • getWorksheet():获取工作表。
  • readData():按行读取数据。startRowendRowstartColendCol 表示要读取的单元格范围,colNames 表示是否读取列名,默认为 TRUE
结论

无论您选择哪个包,读取 Excel 文件并选择特定的行和列都非常简单。readxl 包提供了一个简单的方式读取 Excel 文件,而 openxlsx 包提供了更为灵活和功能丰富的读取方式。根据您的需求选择相应的包即可。