【发布时间】:2017-12-04 12:31:06
【问题描述】:
虽然“PM”可以表示“pm(时间)”,但也可以表示“总理”。
我想捕捉后者。我希望“PM”的引理返回“总理”。如何使用spacy 做到这一点?
返回意外引理的示例:
>>> import spacy
>>> #nlp = spacy.load('en')
>>> nlp = spacy.load('en_core_web_lg')
>>> doc = nlp(u'PM means prime minister')
>>> for word in doc:
... print(word.text, word.lemma_)
...
PM pm
means mean
prime prime
minister minister
根据 doc https://spacy.io/api/annotation,spacy 使用 WordNet 作为引理;
引理是单词的未变形形式。英文词形还原数据取自 WordNet..
当我尝试在Wordnet 中输入“pm”时,它显示“总理”作为引理之一。
我在这里错过了什么?
【问题讨论】:
-
您能否查看现有答案并在他们回答您的问题时批准它们或进一步澄清您的需求?谢谢。
标签: python nlp wordnet spacy lemmatization