【发布时间】:2020-03-20 15:20:58
【问题描述】:
我正在使用函数 text stat_keyness 来查看特定文档组与所有其他文档组相比出现频率最高的单词(所以基本上你输入目标文档组,输出是一个包含单词从最重要到不太重要以及其他一些列有一些统计信息。
我有一个字符向量,其中包含我想要应用凯恩斯分析的所有文档组的名称:
interests_list <- c(unique(data$interest))
(看起来像:chr "0" 、 "340" 、 "456" 等。基本上每个数字对应一组文档)
我可以轻松地将 stat_keyness 应用于单个文档组,如下所示
keyness <- dfm(dfmat_data, groups = "group_interest")
#Calculate keyness and determine audience as target group, compare frequencies of words
between target and reference documents.
result_keyness <- textstat_keyness(keyness, target = "17627")
问题是我不想为每个组单独运行 stat_keyness,因为我有大约 100 个组。 我正在考虑使用 for 循环,但我不确定 如何创建由 text stat_keyness 生成的所有数据帧的列表 到目前为止我写了这个,但我不知道如何存储我将获得的所有结果
for(i in interest_list) {textstat_keyness(keyness, target = i )
}
否则,我尝试了 apply 但它不起作用
keylist <- lapply(keyness, textstat_keyness(keyness, target = interest_list ))
知道如何以任何有效的方式获取我的数据框列表吗?
非常感谢,
卡洛
【问题讨论】: