R中的矩阵与数据框
数据结构是一种在计算机中组织数据的特殊方式,以便可以有效地使用它。这个想法是减少不同任务的空间和时间复杂性。
R 中最重要的两个数据结构是 Matrix 和 Dataframe,它们看起来相同但性质不同。
R中的矩阵 -
它是数据集的同质集合,以二维矩形组织形式排列。它是具有相似数据类型的 am*n 数组。它是使用矢量输入创建的。它具有固定数量的行和列。您可以对 R 矩阵执行许多算术运算,例如加法、减法、乘法和除法。
例子:
Python
# Matrix of two rows
# and three columns
# boolean value by row is true.
# passed as 4th parameter
A = matrix (c(11, 22, 33, 44, 55, 66),
nrow = 2, ncol = 3, byrow = 1)
# Printing Matrix
print(A)
Python
# creating company data frame
comp.data <- data.frame(
# company ids
# data members
comp_id = c (1:3),
# company names
comp_name = c("Geeks", "For", "Geeks"),
growth = c(16000, 14000, 12000),
# company start dates
# data members
comp_start_date = as.Date(c("02/05/10", "04/04/10", "05/03/10"))
)
print(comp.data)
输出:
[, 1] [, 2] [, 3]
[1, ] 11 22 33
[2, ] 44 55 66
应用与使用
- 它在经济学中用于计算一些数据,如 GDP(国内生产总值)或 PI(人均收入价格)。
- 它还有助于研究电气和电子电路。
- 矩阵用于调查研究,即绘制图表等。
- 有助于概率和统计。
R中的数据帧——
它用于存储数据表。它可以在称为字段的多个列中包含多种数据类型。它是一个等长向量的列表。它是矩阵的广义形式。它就像 Excel 工作表中的表格。它有列名和行名。行的名称是唯一的,没有空列。存储的数据必须是数字、字符或因子类型。 DataFrame 是异构的。
例子:
Python
# creating company data frame
comp.data <- data.frame(
# company ids
# data members
comp_id = c (1:3),
# company names
comp_name = c("Geeks", "For", "Geeks"),
growth = c(16000, 14000, 12000),
# company start dates
# data members
comp_start_date = as.Date(c("02/05/10", "04/04/10", "05/03/10"))
)
print(comp.data)
输出 :
应用与使用
- 数据框可以做很多工作,比如拟合统计公式。
- 处理数据(不能使用 Matrix,必须首先转换为 Data Frame)。
- 转置是可能的,即将行更改为列,反之亦然,这在数据科学中很有用。
R中的矩阵v / s数据帧
Matrix | Dataframe |
---|---|
Collection of data sets arranged in a two dimensional rectangular organisation. | Stores data tables that contains multiple data types in multiple column called fields. |
It’s m*n array with similar data type. | It is a list of vector of equal length. It is a generalized form of matrix. |
It has fixed number of rows and columns. | It has variable number of rows and columns. |
The data stored in columns can be only of same data type. | The data stored must be numeric, character or factor type. |
Matrix is homogeneous. | DataFrames is heterogeneous. |