【发布时间】:2017-03-15 14:26:44
【问题描述】:
首先,对不起我的英语,我的英语说得很糟糕。
所以,我对 R 上的 koRpus 包中的 treetag 函数有疑问。 我想对文本进行词形还原,使用 Treetagger 对我来说没问题。 我使用了treetag函数:
treetag(file, treetagger = "manual", lang = "fr",
TT.options = list(path, preset="fr"))
我获得了代币、标签……
但是在此 Lemmatization 之后,我想获得标记的文本,但我没有解决方案来做到这一点。我想用他的引理替换我的文本中的每个标记。
那么,你有我的解决方案吗?
非常感谢!
【问题讨论】:
标签: r lemmatization treetagger korpus