【发布时间】:2015-03-30 08:17:33
【问题描述】:
我想使用 R 在文本中搜索通过 POS 和实际字符串混合表达的模式。 (我在这里的 python 库中看到了这个功能:http://www.clips.ua.ac.be/pages/pattern-search)。
例如,搜索模式可以是:'NOUNPHRASE be|is|was ADJECTIVE than NOUNPHRASE',并且应该返回包含以下结构的所有字符串:“猫比狗快”。
我知道像 openNLP 和 qdap 这样的软件包提供方便的 POS 标记。有没有人将它的输出用于这种模式加工?
【问题讨论】:
标签: regex r nlp tm part-of-speech