如何在 R 编程中从文件中导入数据
事实的集合称为数据。数据可以有不同的形式。要使用 R 编程语言分析数据,应首先在 R 中导入数据,这些数据可以是不同的格式,如 txt、CSV 或任何其他分隔符分隔的文件。导入数据后,然后对其进行操作、分析和报告。
使用 R 编程语言从文件中导入数据
在本文中,我们将了解如何在 R 编程语言中导入不同的文件。
将 CSV 文件导入 R
方法 1:使用 read.csv() 方法。
在这里,我们将使用 R 中的 read.csv() 方法导入 csv 文件。
Syntax: read.csv(path, header = TRUE, sep = “,”)
Arguments :
- path : The path of the file to be imported
- header : By default : TRUE . Indicator of whether to import column headings.
- sep = “,” : The separator for the values in each row.
R
# specifying the path
path <- "/gfg.csv"
# reading contents of csv file
content <- read.csv(path)
# contents of the csv file
print (content)
R
# simple R program to read csv file using read.table()
x <- read.csv2("D://Data//myfile.csv", header = TRUE, sep=", ")
# print x
print(x)
R
# Simple R program to read txt file
x<-read.table("D://Data//myfile.txt", header=FALSE)
# print x
print(x)
R
x <- read.delim("D://Data//myfile.csv", sep="|", header=TRUE)
# print x
print(x)
# print type of x
typeof(x)
R
# Read a JSON file
# Load the package required to read JSON files.
library("rjson")
# Give the input file name to the function.
res <- fromJSON(file = "E:\\exp.json")
# Print the result.
print(res)
HTML
1
Alia
620
IT
2
Brijesh
440
Commerce
3
Yash
600
Humanities
4
Mallika
660
IT
5
Zayn
560
IT
R
# loading the library and other important packages
library("XML")
library("methods")
# the contents of sample.xml are parsed
data <- xmlParse(file = "sample.xml")
print(data)
R
# import haven library package
library("haven")
# Use read_sav() function to read SPSS file
dataframe <- read_sav("SPSS.sav")
dataframe
输出:
ID Name Post Age
1 5 H CA 67
2 6 K SDE 39
3 7 Z Admin 28
方法 2:使用 read.table() 方法。
在这里,我们将使用 read.table() 方法将 CSV 文件导入 R 编程语言。
R
# simple R program to read csv file using read.table()
x <- read.csv2("D://Data//myfile.csv", header = TRUE, sep=", ")
# print x
print(x)
输出:
Col1.Col2.Col3
1 100, a1, b1
2 200, a2, b2
3 300, a3, b3
从文本文件导入数据
我们可以使用基本的 R函数read.table()轻松导入或读取.txt文件。 read.table() 用于读取表格格式的文件。此函数易于使用且灵活。
Syntax:
# read data stored in .txt file
x<-read.table(“file_name.txt”, header=TRUE/FALSE)
R
# Simple R program to read txt file
x<-read.table("D://Data//myfile.txt", header=FALSE)
# print x
print(x)
输出:
V1 V2 V3
1 100 a1 b1
2 200 a2 b2
3 300 a3 b3
如果 header 参数设置为 TRUE,则读取文件中存在的列名。
从分隔文件导入数据
R 有一个函数read.delim()将分隔文件读入列表。默认情况下,文件由 sep="" 表示的制表符分隔,分隔符可以是逗号 (, )、美元符号 ($) 等。
Syntax: read.delim(“file_name.txt”, sep=””, header=TRUE)
R
x <- read.delim("D://Data//myfile.csv", sep="|", header=TRUE)
# print x
print(x)
# print type of x
typeof(x)
输出:
X.V1.V2.V3
1 1, 100, a1, b1
2 2, 200, a2, b2
3 3, 300, a3, b3
[1] "list
在 R 中导入 Json 文件
在这里,我们将使用rjson包将 JSON 文件导入 R 编程语言。
R
# Read a JSON file
# Load the package required to read JSON files.
library("rjson")
# Give the input file name to the function.
res <- fromJSON(file = "E:\\exp.json")
# Print the result.
print(res)
输出:
$ID
[1] "1" "2" "3" "4" "5"
$Name
[1] "Mithuna" "Tanushree" "Parnasha" "Arjun" "Pankaj"
$Salary
[1] "722.5" "815.2" "1611" "2829" "843.25"
在 R 中导入 XML 文件
要在此处导入 XML 文件,我们将使用 R 编程语言中的 XML 包。
用于演示的 XML 文件:
HTML
1
Alia
620
IT
2
Brijesh
440
Commerce
3
Yash
600
Humanities
4
Mallika
660
IT
5
Zayn
560
IT
读取 XML 文件:
安装包后可以读取,然后用xmlparse()函数解析。
R
# loading the library and other important packages
library("XML")
library("methods")
# the contents of sample.xml are parsed
data <- xmlParse(file = "sample.xml")
print(data)
输出:
1
Alia
620
IT
2
Brijesh
440
Commerce
3
Yash
600
Humanities
4
Mallika
660
IT
5
Zayn
560
IT
将 SPSS sav 文件导入 R
在这里,我们将阅读 R 编程语言中的 SPSS .sav 文件。为此,我们将使用 Haven 包。要在 R 中读取 SPSS 文件,我们使用 Haven 包中的 read_sav()函数。
Syntax: read_sav(“FileName.sav”)
R
# import haven library package
library("haven")
# Use read_sav() function to read SPSS file
dataframe <- read_sav("SPSS.sav")
dataframe
输出: