【发布时间】:2019-05-10 14:44:46
【问题描述】:
假设我有像这个示例文本这样的文本数据,下面我需要使用自建字典进行分析。
好X。完美X。华丽X。非凡X。坏X。糟糕X。很差X。
基于此,我想使用此代码结构使用 {quanteda} 构建字典:
dict <- quanteda::dictionary(list(.))
有没有一种方法可以指定我要查找的形容词,而不必为每个感兴趣的形容词输入 X?
# Example of what I want to avoid:
dict <- quanteda::dictionary(list(
list_1 = c("good X", "perfect X",...)
))
所以理想情况下,我需要像“好/完美/... X”这样的东西,但我知道它不会像这样工作。有解决办法吗?
【问题讨论】:
-
你为什么不使用词性标注器和依赖解析器(例如使用 spacyr 或 udpipe),它会用词性标注器向你显示形容词,而依赖解析器会指示哪些词与形容词相关联
标签: r dictionary quanteda