📜  使用 R 计算字符串中的字数

📅  最后修改于: 2022-05-13 01:55:41.036000             🧑  作者: Mango

使用 R 计算字符串中的字数

在这篇文章中,我们将看到如何计算的R中字符的话编程语言的数量。

方法一:使用strsplitsapply方法

R 中的 strsplit() 方法用于根据与定义的正则表达式的匹配返回包含在指定字符串的单词向量。此向量的每个元素都是原始字符串的子字符串。因此,返回向量的长度等于单词的数量。

sapply() 方法:用于计算包含单词的向量的长度。 sapply() 方法用于在向量或列表上应用函数,并根据这些计算返回输出。如果第二个参数,即函数是长度,则返回分割向量的长度。

sapply (str , FUN)

确定复合词的组合方法由 R 中的以下语法定义:

sapply(strsplit(str, " "), length)

代码:

R
# declaring string
str <- "Counting the words in this R sentence?\
Try this approach in GFG! "
  
print ("Original string")
print (str)
print ("Total number of words")
  
# splitting a string by spaces
split <- strsplit(str, " ")
sapply( split , length)


R
# declaring string
str <- "Counting the words in this R sentence? \
Try this approach in GFG! "
  
print ("Original string")
print (str)
print ("Total number of words")
  
# splitting a string by spaces
lengths(gregexpr("\\W+", str)) + 1


R
library("stringr")
  
# declaring string
str <- "Counting the words in this R sentence? Try this approach in GFG! "
print ("Original string")
print (str)
print ("Total number of words")
  
# splitting a string by spaces
str_count(str ,"\\W+")


输出

[1] "Original string"
[1] "Counting the words in this R sentence? Try this approach in GFG! "
[1] "Total number of words"
[1] 12

方法二:使用gregexpr方法。

此方法使用基 R 中可用的各种方法来计算特定字符在 R 中的出现次数。 gregexpr() 方法用于返回与函数参数列表的特定模式匹配的子列表列表。在这种情况下,使用的模式匹配区分大小写。我们案例中的模式是\\W+

然后应用 lengths 方法以返回参数向量的所有元素的单独长度。

此方法使用正则表达式符号 \\W 匹配非单词字符,使用 + 表示一行中的一个或多个。它返回单词之间的分隔符数量,因此在大多数情况下,单词数量实际上是分隔符 + 1。

代码:

电阻

# declaring string
str <- "Counting the words in this R sentence? \
Try this approach in GFG! "
  
print ("Original string")
print (str)
print ("Total number of words")
  
# splitting a string by spaces
lengths(gregexpr("\\W+", str)) + 1  

输出

[1] "Original string"
[1] "Counting the words in this R sentence? Try this approach in GFG! "
[1] "Total number of words"
[1] 13

方法三:使用stringr包

R 中的 stringR 包用于执行字符串操作。它需要明确安装在工作空间中才能访问其方法和例程。

install.packages("stringr")

stringr 包提供了一个str_count()方法,用于计算指定为函数参数的特定模式的出现次数。模式可以是单个字符或一组字符。任何与表达式匹配的实例都会导致计数增加。此方法也可以在字符串向量上调用,并返回一个单独的计数向量,其中包含找到的模式匹配数的单独计数。但是,这种方法仅被认为是正则表达式匹配的近似。如果找不到匹配项,则返回 0。

代码:

电阻

library("stringr")
  
# declaring string
str <- "Counting the words in this R sentence? Try this approach in GFG! "
print ("Original string")
print (str)
print ("Total number of words")
  
# splitting a string by spaces
str_count(str ,"\\W+") 

输出:

[1] "Original string"
[1] "Counting the words in this R sentence? Try this approach in GFG! "
[1] "Total number of words"
[1] 12