📅  最后修改于: 2023-12-03 14:51:46.268000             🧑  作者: Mango
在 R 编程中,数据帧是一个常用的数据结构,通常用于存储表格数据。数据帧由若干个向量组成,其中每个向量代表表格中的一列。
本文将介绍如何从 R 中的给定向量创建数据帧。
在 R 中,我们可以使用 data.frame() 函数创建一个数据帧,该函数的语法如下:
data.frame(..., row.names = NULL, check.rows = FALSE, check.names = TRUE,
stringsAsFactors = default.stringsAsFactors())
其中,... 表示若干个向量,每一个向量代表数据帧的一列。我们可以在函数中指定这些向量的名字,如下所示:
# 创建一个数据帧,包含两列数据和指定的列名
df <- data.frame(x = c(1, 2, 3), y = c("a", "b", "c"))
创建完成后,我们可以使用 str() 函数查看数据帧的结构:
str(df)
输出结果如下:
'data.frame': 3 obs. of 2 variables:
$ x: num 1 2 3
$ y: Factor w/ 3 levels "a","b","c": 1 2 3
从输出结果可以看出,数据帧包含两列数据,分别是 x 和 y。其中,x 是数值型向量,y 是因子型向量,其对应的取值为 a、b 和 c。
除了使用 data.frame() 函数外,我们还可以使用 tibble::tribble() 函数创建数据帧。该函数的语法如下:
tibble::tribble(
~Column1, ~Column2, ...,
value1, value2, ...,
value3, value4, ...,
...
)
其中,~Column1、~Column2 等用于指定数据帧的列名,value1、value2、value3 等用于指定每一列的取值。
示例代码如下:
# 使用 tibble::tribble() 函数创建数据帧,并为各列指定名称
df <- tibble::tribble(
~x, ~y,
1, "a",
2, "b",
3, "c"
)
创建完成后,我们同样可以使用 str() 函数查看数据帧的结构:
str(df)
输出结果如下:
tibble [3 x 2] (S3: tbl_df/tbl/data.frame)
$ x: num 1 2 3
$ y: chr "a" "b" "c"
从输出结果可以看出,数据帧包含两列数据,分别是 x 和 y。其中,x 是数值型向量,y 是字符型向量,其对应的取值为 a、b 和 c。
从 R 中的给定向量创建数据帧很简单,我们可以使用 data.frame() 函数或 tibble::tribble() 函数来实现。同时,我们也可以在函数中设置列名,以便更好地理解数据帧的结构。