【发布时间】:2020-05-18 01:04:47
【问题描述】:
我正在尝试创建两个词都为词干的二元组。但是我的代码只对第二个词进行了词干处理,而对第一个词没有进行词干处理。因此,例如,“担心”和“担心”是分开列出的。
任何帮助将不胜感激。
bigram_text <- text_df %>%
mutate_all(as.character) %>%
unnest_tokens(bigram, text, token = "ngrams", n = 2)%>%
mutate(bigram = wordStem(bigram))
bigramcount<- bigram_text %>%
count(bigram, sort = TRUE)
【问题讨论】:
-
如果您包含一个简单的reproducible example,其中包含可用于测试和验证可能解决方案的示例输入和所需输出,则更容易为您提供帮助。请务必明确列出您正在使用的所有包,以便清楚每个函数的来源。