如何在 R 中手动输入原始数据?
在本文中,我们将讨论如何在 R 编程语言中手动输入原始数据。
在 R 语言中,我们通过各种文件格式导入大量不同的数据集。但有时我们需要以字符向量、数据框或矩阵的形式输入自己的原始数据。有多种方法可以在 R 语言中手动输入原始数据。
输入数据作为向量
要将数据作为 R 语言中的向量输入,我们使用组合函数,即 c()。 c()函数是一个通用函数,它将其参数组合成一个向量。所有参数都被强制转换为一个通用类型。为了创建一个数字向量,我们将数字作为参数传递给 c()函数。为了创建字符向量,我们将字符串或字符作为参数传递给 c()函数。
Syntax: sample_vector <- c( data1, data2, ….. , datan )
where: data1, data2…: determines the numeric values that comprise the vector.
示例:演示基本字符和数字向量。
R
# create numeric vector
numeric <- c(1,2,3,4,5)
# create character vector
character <- c("geeks", "for", "geeks")
# print vectors and their class
print("Character vector:")
character
print("Class:")
class(character)
print("Numeric vector:")
numeric
print("Class:")
class(numeric)
R
# create data frame
data_frame <- data.frame( id = c(1,2,3),
name = c("geeks", "for",
"geeks") )
# print dataframe, summary and its class
print("Data Frame:")
data_frame
print("Class:")
class(data_frame)
print("Summary:")
summary(data_frame)
R
# create 3 column vectors with 3
# rows each for a 3X3 matrix
col1 <- c(1,2,3)
col2 <- c(4,5,6)
col3 <- c(7,8,9)
# merge three column vectors into a matrix
mat <- cbind(col1, col2, col3)
# print matrix, its class and summary
print("Matrix:")
mat
print("Class:")
class(mat)
print("Summary:")
summary(mat)
输出:
Character vector:
"geeks" "for" "geeks"
Class:
"character"
Numeric vector:
1 2 3 4 5
Class:
"numeric"
输入数据作为数据框
要将数据作为 R 语言中的数据框输入,我们使用 data.frame()函数。 data.frame()函数创建紧密耦合的变量集合的数据帧。这些数据帧被广泛用作 R 语言中的基本数据结构。单个数据帧可以包含不同类的不同向量,因此它成为满足所有需求的数据结构。
Syntax:
data_frame <- data.frame( column_name1 = vector1, column_name2 = vector2 )
where,
- column_name1, column_name2: determines the name for columns in data frame
- vector1, vector2: determines the data vector that contain data values for data frame columns.
示例:包含一个数字向量和一个字符向量的基本数据框。
R
# create data frame
data_frame <- data.frame( id = c(1,2,3),
name = c("geeks", "for",
"geeks") )
# print dataframe, summary and its class
print("Data Frame:")
data_frame
print("Class:")
class(data_frame)
print("Summary:")
summary(data_frame)
输出:
Data Frame:
id name
1 1 geeks
2 2 for
3 3 geeks
Class:
"data.frame"
Summary:
id name
Min. :1.0 Length:3
1st Qu.:1.5 Class :character
Median :2.0 Mode :character
Mean :2.0
3rd Qu.:2.5
Max. :3.0
以矩阵形式输入数据
要将数据作为 R 语言中的矩阵输入,我们将矩阵的所有列创建为向量,然后使用列绑定函数cbind() 将它们合并为一个矩阵。 cbind()函数是一个合并函数,它将具有相同行数的两个数据帧或向量组合成一个数据帧。
Syntax: mat <- cbind( col1, col2 )
where, col1, col2: determines the column vectors that are to be merged to form a matrix.
例子:
这里,是使用 cbind()函数制作的 R 语言中的基本 3X3 矩阵。
R
# create 3 column vectors with 3
# rows each for a 3X3 matrix
col1 <- c(1,2,3)
col2 <- c(4,5,6)
col3 <- c(7,8,9)
# merge three column vectors into a matrix
mat <- cbind(col1, col2, col3)
# print matrix, its class and summary
print("Matrix:")
mat
print("Class:")
class(mat)
print("Summary:")
summary(mat)
输出:
Matrix:
col1 col2 col3
[1,] 1 4 7
[2,] 2 5 8
[3,] 3 6 9
Class:
"matrix" "array"
Summary:
col1 col2 col3
Min. :1.0 Min. :4.0 Min. :7.0
1st Qu.:1.5 1st Qu.:4.5 1st Qu.:7.5
Median :2.0 Median :5.0 Median :8.0
Mean :2.0 Mean :5.0 Mean :8.0
3rd Qu.:2.5 3rd Qu.:5.5 3rd Qu.:8.5
Max. :3.0 Max. :6.0 Max. :9.0