📜  R编程数据结构

📅  最后修改于: 2021-01-08 09:25:40             🧑  作者: Mango

R编程中的数据结构

数据结构对于理解非常重要。数据结构是我们将在R中日常处理的对象。对于初学者来说,处理对象转换是最常见的绝望根源。我们可以说R中的所有东西都是对象。

R具有许多数据结构,其中包括:

  • 原子向量
  • 清单
  • 数组
  • 矩阵
  • 数据框
  • 因素

向量

向量是R中的基本数据结构,或者可以说向量是最基本的R数据对象。原子向量有六种类型,例如逻辑,整数,字符,双精度和原始。 “向量是元素的集合,最常见的是模式字符,整数,逻辑或数字”向量可以是以下两种类型之一:

  • 原子向量
  • 清单

清单

在R中,列表是容器。与原子向量不同,列表不限于单一模式。列表包含多种数据类型。该列表也称为通用向量,因为列表的元素可以是任何类型的R对象。 “列表是向量的一种特殊类型,其中每个元素可以是不同的类型。”

我们可以借助list()或as.list()创建一个列表。我们可以使用vector()创建所需长度的空列表。

数组

还有另一种类型的数据对象,可以在两个以上的维度(称为数组)中存储数据。 “数组是具有连续内存分配的相似数据类型的集合。”假设,如果我们创建一个尺寸为(2,3,4)的数组,那么它将创建两个两行三列的四个矩形矩阵。

在R中,借助于array()函数创建一个数组。此函数将向量作为输入,并使用dim参数中的值创建一个数组。

矩阵

矩阵是R对象,其中元素以二维矩形布局排列。在矩阵中,包含相同原子类型的元素。为了进行数学计算,可以使用包含数字元素的矩阵。借助R中的matrix()函数创建一个矩阵。

句法

创建矩阵的基本语法如下:

matrix(data, no_row, no_col, by_row, dim_name)

数据框

数据框是二维数组状结构,或者我们可以说它是一个表,其中每一列包含一个变量的值,而行包含每一列的值的集合。

数据帧具有以下特征:

  • 列名将为非空。
  • 行名将是唯一的。
  • 数据框存储数字,因子或字符类型数据。
  • 每列将包含相同数量的数据项。

因素

因子也是数据对象,用于对数据进行分类并将其存储为级别。因子可以存储字符串和整数。列的唯一值数量有限,因此因子在列中非常有用。它在用于统计建模的数据分析中非常有用。

通过将向量作为输入参数,借助factor()函数创建因子