📅  最后修改于: 2021-01-08 09:40:20             🧑  作者: Mango
向量是一种基本的数据结构,在R编程中起着重要的作用。
在R中,共享相同数据类型的元素序列称为向量。向量支持逻辑,整数,双精度,字符,复杂或原始数据类型。向量中包含的元素称为向量的组成部分。我们可以借助typeof()函数检查向量的类型。
长度是向量的重要属性。向量长度基本上是向量中元素的数量,它是通过length()函数的。
向量分为两部分,即原子向量和列表。它们具有三个通用属性,即函数类型,函数长度和属性函数 。
原子向量和列表之间只有一个区别。在原子向量中,所有元素都是相同的类型,但是在列表中,元素是不同的数据类型。在本节中,我们将仅讨论原子向量。我们将在下一个主题中简要讨论列表。
在R中,我们使用c()函数创建向量。此函数返回一维数组或简单的向量。 c()函数是结合了其参数的通用函数。所有参数均受通用数据类型(即返回值的类型)的限制。有多种其他方法可以在R中创建向量,如下所示:
我们可以在冒号运算符的帮助下创建向量。使用冒号运算符有以下语法:
z<-x:y
该运算符创建一个向量,其元素从x到y,并将其分配给z。
例:
a<-4:-10
a
输出量
[1] 4 3 2 1 0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10
在R中,我们可以借助seq()函数创建一个向量。序列函数将元素序列创建为向量。 seq()函数有两种使用方式,即通过使用?by参数设置步长或通过'length.out'功能指定向量的长度。
例:
seq_vec<-seq(1,4,by=0.5)
seq_vec
class(seq_vec)
输出量
[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0
例:
seq_vec<-seq(1,4,length.out=6)
seq_vec
class(seq_vec)
输出量
[1] 1.0 1.6 2.2 2.8 3.4 4.0
[1] "numeric"
在R中,有四种类型的原子向量。原子载体在数据科学中起着重要作用。原子向量是借助c()函数的。这些原子向量如下:
十进制值在R中被称为数字数据类型。如果我们将十进制值分配给任何变量d,则此d变量将成为数字类型。包含数字元素的向量称为数字向量。
例:
d<-45.5
num_vec<-c(10.1, 10.2, 33.2)
d
num_vec
class(d)
class(num_vec)
输出量
[1] 45.5
[1] 10.1 10.2 33.2
[1] "numeric"
[1] "numeric"
非分数数值称为整数数据。该整数数据由“ Int”表示。 Int大小为2个字节,long Int大小为4个字节。有两种将整数值分配给变量的方法,即使用as.integer()函数并将L附加到该值。
包含整数元素的向量称为整数向量。
例:
d<-as.integer(5)
e<-5L
int_vec<-c(1,2,3,4,5)
int_vec<-as.integer(int_vec)
int_vec1<-c(1L,2L,3L,4L,5L)
class(d)
class(e)
class(int_vec)
class(int_vec1)
输出量
[1] "integer"
[1] "integer"
[1] "integer"
[1] "integer"
字符以一字节整数的形式保存在内存中。在R中,有两种不同的方式来创建字符数据类型值,即使用as。字符()函数,并在双引号(“”)或单引号(“)之间键入字符串。
包含字符元素的向量称为整数向量。
例:
d<-'shubham'
e<-"Arpita"
f<-65
f<-as.character(f)
d
e
f
char_vec<-c(1,2,3,4,5)
char_vec<-as.character(char_vec)
char_vec1<-c("shubham","arpita","nishka","vaishali")
char_vec
class(d)
class(e)
class(f)
class(char_vec)
class(char_vec1)
输出量
[1] "shubham"
[1] "Arpita"
[1] "65"
[1] "1" "2" "3" "4" "5"
[1] "shubham" "arpita" "nishka" "vaishali"
[1] "character"
[1] "character"
[1] "character"
[1] "character"
[1] "character"
逻辑数据类型只有两个值,即True或False。这些值基于满足的条件。包含布尔值的向量称为逻辑向量。
例:
d<-as.integer(5)
e<-as.integer(6)
f<-as.integer(7)
g<-d>e
h<-e
输出量
[1] FALSE
[1] TRUE
[1] TRUE TRUE FALSE TRUE FALSE FALSE
[1] "logical"
[1] "logical"
[1] "logical"
我们可以借助向量索引来访问向量的元素。索引表示向量中存储值的位置。索引将在整数,字符或逻辑的帮助下执行。
在整数向量上,索引的执行方式与在C,C++和Java中应用的方式相同。只有一个区别,即在C,C++和Java中,索引从0开始,但是在R中,索引从1开始。像其他编程语言一样,我们通过在方括号中指定整数值来执行索引。到我们的向量。
例:
seq_vec<-seq(1,4,length.out=6)
seq_vec
seq_vec[2]
输出量
[1] 1.0 1.6 2.2 2.8 3.4 4.0
[1] 1.6
在字符向量索引中,我们为向量的每个元素分配一个唯一键。这些键是每个元素的唯一定义,可以很容易地访问。让我们看一个例子来了解它是如何执行的。
例:
char_vec<-c("shubham"=22,"arpita"=23,"vaishali"=25)
char_vec
char_vec["arpita"]
输出量
shubham arpita vaishali
22 23 25
arpita
23
在逻辑索引中,它返回其对应位置具有逻辑矢量TRUE的那些位置的值。让我们看一个例子,以了解如何在向量上执行它。
例:
a<-c(1,2,3,4,5,6)
a[c(TRUE,FALSE,TRUE,TRUE,FALSE,TRUE)]
输出量
[1] 1 3 4 6
在R中,对向量执行各种操作。我们可以彼此相加,相减,相乘或相除两个或多个向量。在数据科学中,R扮演着重要角色,并且数据操作需要进行操作。对向量执行以下类型的操作。
c()函数不仅用于创建向量,而且还用于组合两个向量。通过组合一个或多个向量,它形成一个新向量,其中包含每个向量的所有元素。让我们看一个例子,看看c()函数如何组合向量。
例:
p<-c(1,2,4,5,7,8)
q<-c("shubham","arpita","nishka","gunjan","vaishali","sumit")
r<-c(p,q)
输出量
[1] "1" "2" "4" "5" "7" "8"
[7] "shubham" "arpita" "nishka" "gunjan" "vaishali" "sumit"
我们可以对向量执行所有算术运算。算术运算是对向量逐个成员执行的。我们可以加,减,乘或除两个向量。让我们看一个例子,以了解如何对向量执行算术运算。
例:
a<-c(1,3,5,7)
b<-c(2,4,6,8)
a+b
a-b
a/b
a%%b
输出量
[1] 3 7 11 15
[1] -1 -1 -1 -1
[1] 2 12 30 56
[1] 0.5000000 0.7500000 0.8333333 0.8750000
[1] 1 3 5 7
借助R中的逻辑索引向量,我们可以从给定向量形成一个新向量。该向量的长度与原始向量的长度相同。仅当切片中包含原始向量的相应成员时,向量成员才为TRUE;否则,向量成员为TRUE。否则,它将是错误的。让我们看一个例子,以了解如何在逻辑索引向量的帮助下形成一个新向量。
例:
a<-c("Shubham","Arpita","Nishka","Vaishali","Sumit","Gunjan")
b<-c(TRUE,FALSE,TRUE,TRUE,FALSE,FALSE)
a[b]
输出量
[1] "Shubham" "Nishka" "Vaishali"
在R中,我们指定方括号[]之间的索引以索引数值。如果我们的索引为负,它将返回除我们指定的索引以外的所有值。例如,指定[-3]将提示R将-3转换为其绝对值,然后搜索占用该索引的值。
例:
q<-c("shubham","arpita","nishka","gunjan","vaishali","sumit")
q[2]
q[-4]
q[15]
输出量
[1] "arpita"
[1] "shubham" "arpita" "nishka" "vaishali" "sumit"
[1] NA
索引向量允许重复值,这意味着我们可以在一个操作中访问一个元素两次。让我们看一个例子来了解重复索引是如何工作的。
例:
q<-c("shubham","arpita","nishka","gunjan","vaishali","sumit")
q[c(2,4,4,3)]
输出量
[1] "arpita" "gunjan" "gunjan" "nishka"
范围索引用于对向量进行切片以形成新向量。对于切片,我们使用了冒号(:)运算符。范围索引对于涉及大型运算符的情况非常有帮助。让我们看一个示例,以了解如何在冒号运算符的帮助下完成切片以形成新矢量。
例:
q<-c("shubham","arpita","nishka","gunjan","vaishali","sumit")
b<-q[2:5]
b
输出量
[1] "arpita" "nishka" "gunjan" "vaishali"
在R中,索引向量可能是乱序的。下面是一个示例,其中矢量切片的第一和第二值的顺序颠倒了。
例:
q<-c("shubham","arpita","nishka","gunjan","vaishali","sumit")b<-q[2:5]
q[c(2,1,3,4,5,6)]
输出量
[1] "arpita" "shubham" "nishka" "gunjan" "vaishali" "sumit"
我们首先将字符向量创建为:
z=c("TensorFlow","PyTorch")
z
输出量
[1] "TensorFlow" "PyTorch"
创建字符矢量后,我们将第一个矢量成员命名为“开始”,将第二个成员命名为“结束”,分别为:
names(z)=c("Start","End")
z
输出量
Start End
"TensorFlow" "PyTorch"
我们按名称检索第一个成员,如下所示:
z["Start"]
输出量
Start
"TensorFlow"
我们可以逆转以<字符>索引向量的帮助下订单。
z[c("Second","First")]
输出量
Second First
"PyTorch" "TensorFlow"