📜  R中的矩阵与数据框

📅  最后修改于: 2022-05-13 01:55:25.929000             🧑  作者: Mango

R中的矩阵与数据框

数据结构是一种在计算机中组织数据的特殊方式,以便可以有效地使用它。这个想法是减少不同任务的空间和时间复杂性。
R 中最重要的两个数据结构是 Matrix 和 Dataframe,它们看起来相同但性质不同。

R中的矩阵 -

它是数据集的同质集合,以二维矩形组织形式排列。它是具有相似数据类型的 am*n 数组。它是使用矢量输入创建的。它具有固定数量的行和列。您可以对 R 矩阵执行许多算术运算,例如加法、减法、乘法和除法。
例子:

Python
# Matrix of two rows
# and three columns
# boolean value by row is true.
# passed as 4th parameter
A = matrix (c(11, 22, 33, 44, 55, 66),
            nrow = 2, ncol = 3, byrow = 1)
 
# Printing Matrix
print(A)


Python
# creating company data frame
comp.data <- data.frame(
 
# company ids
# data members
comp_id = c (1:3),
 
# company names
comp_name = c("Geeks", "For", "Geeks"),
growth = c(16000, 14000, 12000),
 
# company start dates
# data members
comp_start_date = as.Date(c("02/05/10", "04/04/10", "05/03/10"))
)
print(comp.data)


输出:

[, 1] [, 2] [, 3]
[1, ]   11   22   33
[2, ]   44   55   66

应用与使用

  • 它在经济学中用于计算一些数据,如 GDP(国内生产总值)或 PI(人均收入价格)。
  • 它还有助于研究电气和电子电路。
  • 矩阵用于调查研究,即绘制图表等。
  • 有助于概率和统计。

R中的数据帧——

它用于存储数据表。它可以在称为字段的多个列中包含多种数据类型。它是一个等长向量的列表。它是矩阵的广义形式。它就像 Excel 工作表中的表格。它有列名和行名。行的名称是唯一的,没有空列。存储的数据必须是数字、字符或因子类型。 DataFrame 是异构的。
例子:

Python

# creating company data frame
comp.data <- data.frame(
 
# company ids
# data members
comp_id = c (1:3),
 
# company names
comp_name = c("Geeks", "For", "Geeks"),
growth = c(16000, 14000, 12000),
 
# company start dates
# data members
comp_start_date = as.Date(c("02/05/10", "04/04/10", "05/03/10"))
)
print(comp.data)

输出 :

R-Dataframe-01

应用与使用

  • 数据框可以做很多工作,比如拟合统计公式。
  • 处理数据(不能使用 Matrix,必须首先转换为 Data Frame)。
  • 转置是可能的,即将行更改为列,反之亦然,这在数据科学中很有用。
R中的矩阵v / s数据帧
MatrixDataframe
Collection of data sets arranged in a two dimensional rectangular organisation.Stores data tables that contains multiple data types in multiple column called fields.
It’s m*n array with similar data type.It is a list of vector of equal length. It is a generalized form of matrix.
It has fixed number of rows and columns.It has variable number of rows and columns.
The data stored in columns can be only of same data type.The data stored must be numeric, character or factor type.
Matrix is homogeneous.DataFrames is heterogeneous.