📅  最后修改于: 2023-12-03 15:23:17.279000             🧑  作者: Mango
CSV(Comma Separated Values,逗号分隔值)是一种常见的文本格式,用于存储表格结构的数据。在 R 中,可以使用 read.csv()
或 read.csv2()
函数读取 CSV 文件。
read.csv(file, header = TRUE, sep = ",", quote = "\"",
dec = ".", fill = TRUE, comment.char = "", ...)
read.csv2(file, header = TRUE, sep = ";", quote = "\"",
dec = ",", fill = TRUE, comment.char = "", ...)
参数说明:
file
: 要读取的 CSV 文件路径,可以是本地文件路径或者 URL。header
: 是否将第一行作为列名,默认为 TRUE
。sep
: 字段分隔符,默认为逗号 ,
。quote
: 字段引号,默认为双引号 "
。dec
: 十进制符号,默认为点号 .
。fill
: 是否将缺失值填充,默认为 TRUE
。comment.char
: 注释字符,默认为空字符。...
: 其他需要传递给 read.table()
函数的参数。假设有如下 CSV 文件 example.csv
:
"ID","Name","Gender","Age"
101,"Tom","Male",28
102,"Lisa","Female",26
103,"Tony","Male",32
104,"Alice","Female",24
首先,需要将当前工作目录设置为包含 example.csv
文件的目录,这可以使用 setwd()
函数实现:
# 将当前工作目录设置为包含 example.csv 文件的目录
setwd("/path/to/folder")
注意:在实际使用中,需要将/path/to/folder
改为实际的目录路径。
接下来,使用 read.csv()
函数读取 CSV 文件:
# 读取 example.csv 文件
data <- read.csv("example.csv")
print(data)
运行结果:
ID Name Gender Age
1 101 Tom Male 28
2 102 Lisa Female 26
3 103 Tony Male 32
4 104 Alice Female 24
通过设置 header = FALSE
参数可以将第一行视为数据而不是列名:
# 将第一行视为数据而不是列名
data <- read.csv("example.csv", header = FALSE)
print(data)
运行结果:
V1 V2 V3 V4
1 ID Name Gender Age
2 101 Tom Male 28
3 102 Lisa Female 26
4 103 Tony Male 32
5 104 Alice Female 24
如果 CSV 文件的字段分隔符不是逗号 ,
,可以通过设置 sep
参数来指定。例如,如果 CSV 文件的字段分隔符是分号 ;
,可以这样读取:
# 读取分隔符为分号的 CSV 文件
data <- read.csv("example.csv", sep = ";")
print(data)
运行结果:
ID Name Gender Age
1 101 Tom Male 28
2 102 Lisa Female 26
3 103 Tony Male 32
4 104 Alice Female 24
使用 read.csv()
或 read.csv2()
函数可以方便地读取 CSV 文件。这些函数有很多可选参数,可以灵活地设置读取参数。在读取 CSV 文件前,需要将当前工作目录设置为包含 CSV 文件的目录。