仅从 R 中的 CSV 导入选定的数据列
在本文中,我们将研究使用 R 编程语言从 CSV 文件中导入选定数据列的两种不同方法。
方法一:使用read.table()函数
在这种只导入 CSV 文件数据的选定列的方法中,用户需要调用 read.table()函数,该函数是 R 编程语言的内置函数,然后将选定列的参数传递给从数据中导入特定列。在这里,用户必须将空值传递给参数,以避免导入该特定列。
read.table()函数读取表格格式的文件并从中创建一个数据框,案例对应于文件中的行和变量到字段。
Syntax:
read.table(file, header, nrows, skip, colClasses, sep)
Parameters:
- file: Specifies the name of the file.
- header:The header is a logical flag indicating whether the first line is a header line contains data or not.
- nrows: Specifies number of rows in the dataset.
- skip: Helps in skipping of lines from the beginning.
- colClasses: It is a character vector which indicates class of each column of the data set.
- sep: It a string indicating the way the columns are separated that is by commas, spaces, colons, tabs etc.
使用中的数据集:
例子:
R
gfg_data <- read.table("gfg_data.csv", header = TRUE, sep = ",",
colClasses = c("numeric", "NULL", "NULL",
"numeric", "NULL"))
gfg_data
R
library("data.table")
gfg_data <- fread("gfg_data.csv",
select = c("A", "C", "E"))
gfg_data
输出:
方法 2:使用 data.table 包中的 fread()函数:
在这种只将选定的列导入R编程语言的方法中,用户首先需要在R控制台中安装并导入data.table包,并调用data.table包的函数read()函数,用要在此函数的 select 参数中导入的文件位置和选定列。此外,这将导致导入所选列
fread()函数更快更方便的对sep、colClasses、nrows等控件进行自动检测
Syntax:
fread(file, sep, colClasses, nrows)
Parameter:
- file: Specifies the name of the file.
- colClasses: It is a character vector which indicates class of each column of the data set.
- sep: It a string indicating the way the columns are separated that is by commas, spaces, colons, tabs etc.
- nrows: Specifies number of rows in the dataset.
例子:
电阻
library("data.table")
gfg_data <- fread("gfg_data.csv",
select = c("A", "C", "E"))
gfg_data
输出: