【发布时间】:2021-09-09 23:22:58
【问题描述】:
我想在 Spacy 中使用德语的词形还原器,但我对结果感到非常惊讶:
import spacy
nlp = spacy.load("de_dep_news_trf")
[token.lemma_ for token in nlp('ich du er sie mein dein sein ihr unser')]
给予
['ich', 'du', 'ich', 'ich', 'meinen', 'mein', 'mein', 'mein', 'sich']
我不确定我是否可以使用它:
vielen dank für deinen sehr guten tweet
变成
viel danken für mein sehr gut tweet
这明显改变了句子的意思。
这是预期的吗?我是否缺少使词形还原器不那么“激进”的调整/配置?
【问题讨论】:
标签: spacy lemmatization