📜  在 R 编程中使用 Excel 文件

📅  最后修改于: 2022-05-13 01:54:26.411000             🧑  作者: Mango

在 R 编程中使用 Excel 文件

Excel 文件的扩展名为 .xls、.xlsx 和 .csv(逗号分隔值)。要开始在 R 编程语言中使用 excel 文件,我们需要首先在 RStudio 或任何其他支持 R 的 IDE(集成开发环境)中导入 excel 文件。

用 R 编程语言读取 Excel 文件

首先,在 R 中安装readxl包以加载 excel 文件。进一步演示了包括其子部分在内的各种方法。

Sample_data1.xlsx:

Sample_data2.xlsx:

阅读文件:

两个excel文件 Sample_data1.xlsx 和 Sample_data2.xlsx 从工作目录中读取。

R
# Working with Excel Files
# Installing required package
install.packages("readxl")
 
# Loading the package
library(readxl)
 
# Importing excel file
Data1 < - read_excel("Sample_data1.xlsx")
Data2 < - read_excel("Sample_data2.xlsx")
 
# Printing the data
head(Data1)
head(Data2)


R
# Modifying the files
Data1$Pclass <- 0
 
Data2$Embarked <- "S"
 
# Printing the data
head(Data1)
head(Data2)


R
# Deleting from files
Data1 <- Data1[-2]
 
Data2 <- Data2[-3]
 
# Printing the data
Data1
Data2


R
# Merging Files
Data3 <- merge(Data1, Data2, all.x = TRUE, all.y = TRUE)
 
# Displaying the data
head(Data3)


R
# Creating feature in Data1 dataset
Data1$Num < - 0
 
# Creating feature in Data2 dataset
Data2$Code < - "Mission"
 
# Printing the data
head(Data1)
head(Data2)


R
# Installing the package
install.packages("writexl")
 
# Loading package
library(writexl)
 
# Writing Data1
write_xlsx(Data1, "New_Data1.xlsx")
 
# Writing Data2
write_xlsx(Data2, "New_Data2.xlsx")


excel 文件作为数据帧加载到变量 Data_1 和Data_2中,然后调用变量 Data_1 和 Data_2 来打印数据集。

修改文件

Sample_data1.xlsx 文件和 Sample_file2.xlsx 被修改。

R

# Modifying the files
Data1$Pclass <- 0
 
Data2$Embarked <- "S"
 
# Printing the data
head(Data1)
head(Data2)

Data1数据的P类属性或变量的值修改为0。Data2的Embarked属性或变量的值修改为S。

从文件中删除内容

从包含 Sample_data1.xlsx 和 Sample_data2.xlsx 文件的 Data1 和 Data2 数据集中删除变量或属性。

R

# Deleting from files
Data1 <- Data1[-2]
 
Data2 <- Data2[-3]
 
# Printing the data
Data1
Data2

符号用于从数据集中删除列或属性。从 Data1 数据集中删除第 2 列,从 Data2 数据集中删除第 3 列。

合并文件

两个 excel 数据集 Data1 和 Data2 使用merge()函数合并,该函数位于基本包中,并预安装在 R 中。

R

# Merging Files
Data3 <- merge(Data1, Data2, all.x = TRUE, all.y = TRUE)
 
# Displaying the data
head(Data3)

Data1 和 Data2 相互合并,生成的文件存储在 Data3 变量中。

创建新列

可以在 Data1 和 Data2 数据集中轻松创建新列或特征。

R

# Creating feature in Data1 dataset
Data1$Num < - 0
 
# Creating feature in Data2 dataset
Data2$Code < - "Mission"
 
# Printing the data
head(Data1)
head(Data2)

Num是在 Data1 数据集中使用 0 默认值创建的新特征。代码是一项新功能,使用任务作为 Data2 数据集中的默认字符串创建。

写入文件

执行完所有操作后,使用 writexl 包中内置的write.xlsx()函数将 Data1 和 Data2 写入新文件。

R

# Installing the package
install.packages("writexl")
 
# Loading package
library(writexl)
 
# Writing Data1
write_xlsx(Data1, "New_Data1.xlsx")
 
# Writing Data2
write_xlsx(Data2, "New_Data2.xlsx")

Data1 数据集写入New_Data1.xlsx文件,Data2 数据集写入New_Data2.xlsx文件。这两个文件都保存在当前工作目录中。