【发布时间】:2020-11-27 19:15:57
【问题描述】:
从这个过程
library(stm)
library(tidyr)
library(quanteda)
testDfm <- gadarian$open.ended.response %>%
tokens(remove_punct = TRUE, remove_numbers = TRUE, remove_symbols = TRUE) %>%
dfm()
假设我们检查了 frq
dftextstat <- textstat_frequency(testDfm)
我们想从 dfm 中删除一些特定的单词。根据我们要删除的dftextstat c("and", "to") 有什么方法可以在dfm中制作它而无需再次运行这些行来创建dfm?
【问题讨论】:
-
你能做一个可重现的例子吗
-
@akrun 是的,请查看更新的代码