📜  将 CSV 文件读入 R 中的数据帧(1)

📅  最后修改于: 2023-12-03 15:25:13.285000             🧑  作者: Mango

将 CSV 文件读入 R 中的数据框

在 R 编程中,我们经常需要将数据读入 R 中进行数据分析和可视化。而 CSV (Comma Separated Values) 文件是一种常见的数据文件格式,它以逗号作为字段分隔符,每一行代表一条记录,每一列代表一种属性,它的优点是易于读写和传输。

下面我们将介绍如何在 R 中将 CSV 文件读入数据框。

读取 CSV 文件

R 提供了多种读取 CSV 文件的函数,其中最常用的是 read.csv()read.csv2()。它们的区别在于分隔符的不同,read.csv() 默认使用逗号作为分隔符,而 read.csv2() 使用分号作为分隔符。

# 读取 CSV 文件
data <- read.csv("data.csv")

# 查看数据框信息
str(data)
head(data)

以上代码中,我们通过 read.csv() 函数读取了名为 data.csv 的 CSV 文件,并将其存储为数据框 data。然后使用 str()head() 函数查看了数据框的信息和前 6 行数据。

设置参数

read.csv()read.csv2() 函数还提供了许多参数来控制读取过程。下面是一些常用的参数:

  • file: 文件路径和文件名。
  • header: 是否将第一行作为列名,缺省为 TRUE
  • sep: 字段分隔符,默认为逗号。
  • dec: 小数点在数值中的位置,默认为 .
  • stringsAsFactors: 是否将字符串变量转换为因子变量,默认为 TRUE
# 设置参数
data <- read.csv("data.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE)

# 查看数据框信息
str(data)
head(data)

以上代码中,我们将参数 header 设置为 TRUE,表示 CSV 文件的第一行包含列名。将参数 sep 设置为逗号,表示逗号是字段分隔符。将参数 stringsAsFactors 设置为 FALSE,表示不将字符串变量转换为因子变量。

其他读取函数

除了 read.csv()read.csv2() 函数,还有其他的函数可以读取 CSV 文件,比如 read.table()data.table::fread(),它们可以更加灵活地读取不同格式的文本文件。

# 使用 read.table() 函数读取 CSV 文件
data <- read.table("data.csv", sep = ",", header = TRUE)

# 使用 data.table::fread() 函数读取 CSV 文件
library(data.table)
data <- fread("data.csv", header = TRUE, sep = ",")

以上代码中,我们分别使用 read.table()data.table::fread() 函数读取了名为 data.csv 的 CSV 文件。其中,read.table() 函数可以读取任意格式的文本文件,默认以空格作为分隔符;data.table::fread() 函数则是 data.table 包提供的函数,速度非常快,特别适用于大型数据集的读取。