在 R 编程中使用 Excel 文件
Excel 文件的扩展名为 .xls、.xlsx 和 .csv(逗号分隔值)。要开始在 R 编程语言中使用 excel 文件,我们需要首先在 RStudio 或任何其他支持 R 的 IDE(集成开发环境)中导入 excel 文件。
用 R 编程语言读取 Excel 文件
首先,在 R 中安装readxl包以加载 excel 文件。进一步演示了包括其子部分在内的各种方法。
Sample_data1.xlsx:
Sample_data2.xlsx:
阅读文件:
两个excel文件 Sample_data1.xlsx 和 Sample_data2.xlsx 从工作目录中读取。
R
# Working with Excel Files
# Installing required package
install.packages("readxl")
# Loading the package
library(readxl)
# Importing excel file
Data1 < - read_excel("Sample_data1.xlsx")
Data2 < - read_excel("Sample_data2.xlsx")
# Printing the data
head(Data1)
head(Data2)
R
# Modifying the files
Data1$Pclass <- 0
Data2$Embarked <- "S"
# Printing the data
head(Data1)
head(Data2)
R
# Deleting from files
Data1 <- Data1[-2]
Data2 <- Data2[-3]
# Printing the data
Data1
Data2
R
# Merging Files
Data3 <- merge(Data1, Data2, all.x = TRUE, all.y = TRUE)
# Displaying the data
head(Data3)
R
# Creating feature in Data1 dataset
Data1$Num < - 0
# Creating feature in Data2 dataset
Data2$Code < - "Mission"
# Printing the data
head(Data1)
head(Data2)
R
# Installing the package
install.packages("writexl")
# Loading package
library(writexl)
# Writing Data1
write_xlsx(Data1, "New_Data1.xlsx")
# Writing Data2
write_xlsx(Data2, "New_Data2.xlsx")
excel 文件作为数据帧加载到变量 Data_1 和Data_2中,然后调用变量 Data_1 和 Data_2 来打印数据集。
修改文件
Sample_data1.xlsx 文件和 Sample_file2.xlsx 被修改。
R
# Modifying the files
Data1$Pclass <- 0
Data2$Embarked <- "S"
# Printing the data
head(Data1)
head(Data2)
Data1数据的P类属性或变量的值修改为0。Data2的Embarked属性或变量的值修改为S。
从文件中删除内容
从包含 Sample_data1.xlsx 和 Sample_data2.xlsx 文件的 Data1 和 Data2 数据集中删除变量或属性。
R
# Deleting from files
Data1 <- Data1[-2]
Data2 <- Data2[-3]
# Printing the data
Data1
Data2
–符号用于从数据集中删除列或属性。从 Data1 数据集中删除第 2 列,从 Data2 数据集中删除第 3 列。
合并文件
两个 excel 数据集 Data1 和 Data2 使用merge()函数合并,该函数位于基本包中,并预安装在 R 中。
R
# Merging Files
Data3 <- merge(Data1, Data2, all.x = TRUE, all.y = TRUE)
# Displaying the data
head(Data3)
Data1 和 Data2 相互合并,生成的文件存储在 Data3 变量中。
创建新列
可以在 Data1 和 Data2 数据集中轻松创建新列或特征。
R
# Creating feature in Data1 dataset
Data1$Num < - 0
# Creating feature in Data2 dataset
Data2$Code < - "Mission"
# Printing the data
head(Data1)
head(Data2)
Num是在 Data1 数据集中使用 0 默认值创建的新特征。代码是一项新功能,使用任务作为 Data2 数据集中的默认字符串创建。
写入文件
执行完所有操作后,使用 writexl 包中内置的write.xlsx()函数将 Data1 和 Data2 写入新文件。
R
# Installing the package
install.packages("writexl")
# Loading package
library(writexl)
# Writing Data1
write_xlsx(Data1, "New_Data1.xlsx")
# Writing Data2
write_xlsx(Data2, "New_Data2.xlsx")
Data1 数据集写入New_Data1.xlsx文件,Data2 数据集写入New_Data2.xlsx文件。这两个文件都保存在当前工作目录中。