【发布时间】:2018-08-29 15:28:59
【问题描述】:
这里是一个简单的问题,可能与this 重复?
我试图弄清楚如何计算一个单词在向量中出现的次数。我知道我可以计算一个单词出现的行数,如下所示:
temp <- tibble(idvar = 1:3,
response = (c("This sounds great",
"This is a great idea that sounds great",
"What a great idea")))
temp %>% count(grepl("great", response)) # lots of ways to do this line
# answer = 3
上面代码中的答案是 3,因为“great”出现在三行中。然而,“伟大”一词在向量“响应”中出现了 4 次不同的时间。我该如何找到它?
【问题讨论】:
-
您是否打算提供一个特定的单词并获得您想要的数字?或者您想为所有句子中出现的每个单词获取该数字?
-
只是打算提供一个特定的词并获取数字。我可以使用
tidytextunnest 将句子拆分为标记,然后计算单词。 (但如果您有其他方法的建议,我会全力以赴!) -
我也想到了
tidytext:)