【发布时间】:2018-01-02 09:17:26
【问题描述】:
我正在尝试弄脏 nltk。我指的是http://victoria.lviv.ua/../NaturalLanguageProcessingWithPython.pdf。它指出nltk.pos_tag 函数将词性分配给单词列表中的每个单词,并作为参数传递给它。
继续前进,我发现还有nltk.DefaultTagger、nltk.RegexpTagger、nltk.UnigramTagger 和nltk.BigramTagger。
我很困惑,为什么我们需要这些标注器,因为 nltk.pos_tag 在标注词性方面做得很好。此外,nltk.pos_tag 在内部使用哪个标记器进行标记。
提前致谢。
【问题讨论】: