【发布时间】:2018-01-17 07:40:26
【问题描述】:
一般来说,在自然语言处理中,我们希望得到一个记号的引理。
例如,我们可以使用 wordnet 词形还原将 'eaten' 映射到 'eat'。
python中是否有任何工具可以将引理反转为某种形式?
例如,我们将 'go' 映射到 'gone' 给定目标形式 'eaten'。
PS:有人提到我们必须存储这样的映射。 How to un-stem a word in Python?
【问题讨论】:
-
POS 信息也可以用来获得某种形式的引理。
-
你怎么知道你是否将“go”映射到“gone”或“goes”或“went”......等等。 .如果需要,您需要保存一个带有可能变化列表的引理(如果您想从这些“增强的引理”重新创建文本,可能还有它们的位置)
-
@Adonis 我会添加其他变量作为约束或目标。例如,def inverse_lemma(**args)。 'gone' = inverse_lemma(lemma='go', target_form='eaten', target_pos='VBN')。像这样。
标签: python nlp nltk lemmatization