📅  最后修改于: 2023-12-03 15:38:24.811000             🧑  作者: Mango
在 R 中,我们可以使用 dplyr
包来对数据进行分组,进而做出更深入的分析。本文将介绍如何在 R 中对愤怒进行分组,并以一个示例数据集为例。
首先,我们需要读入一个数据集。本文使用的是 sentiments
包中的 afinn
数据集,该数据集记录了一些单词的情感价值得分。我们可以使用以下代码将其导入并查看其前几行数据。
library(sentimentr)
library(dplyr)
data(afinn)
head(afinn)
我们可以通过 group_by()
函数将数据按照一定的规则分组,然后进行统计分析。
由于 afinn
数据集中包括了一些单词的情感价值得分,我们可以利用这些得分来计算文本中的情感得分并进行分组。下面的代码把愤怒得分大于 0 的单词看作是“愤怒”的单词,然后对文本按照这个标准进行分组。
example_text <- "I am so angry right now. This is really pissing me off."
scores <- get_sentiment(example_text)
word_scores <- scores$word_scores %>%
filter(score > 0, sentiment == "negative") %>%
mutate(emotion = "anger")
word_scores
上述代码中,我们首先先使用 get_sentiment()
函数将文本转化为情感得分,然后再筛选出愤怒得分大于 0 且情感为负面的单词,并赋予其一个“anger”的情感标签。最终我们得到了下面的数据集。
# A tibble: 1 x 4
word score sentiment emotion
<chr> <dbl> <chr> <chr>
1 angry 2 negative anger
在 R 中,我们可以使用 dplyr
包对数据进行分组,进而做出更深入的分析。本文以一个示例数据集为例,介绍了如何在 R 中对愤怒进行分组的方法。