【问题标题】:Treetag package koRpus RTreetag 包 koRpus R
【发布时间】:2017-03-15 14:26:44
【问题描述】:

首先,对不起我的英语,我的英语说得很糟糕。

所以,我对 R 上的 koRpus 包中的 treetag 函数有疑问。 我想对文本进行词形还原,使用 Treetagger 对我来说没问题。 我使用了treetag函数:

treetag(file, treetagger = "manual", lang = "fr",
        TT.options = list(path, preset="fr")) 

我获得了代币、标签……

但是在此 Lemmatization 之后,我想获得标记的文本,但我没有解决方案来做到这一点。我想用他的引理替换我的文本中的每个标记。

那么,你有我的解决方案吗?

非常感谢!

【问题讨论】:

    标签: r lemmatization treetagger korpus


    【解决方案1】:
    Proof next steps:
    
    txt1 <- treetag(c(“played”, “saw”),
    treetagger=”manual”, lang=”en”,
    encoding = “UTF-8″,
    TT.options=list(path=”C:/TreeTagger”, preset=”en”),
    format = “obj”)
    
    text2 <- slot(txt1 , "TT.res")
    
    text3<- ifelse(text2$lemma == "<unknown>", text2 $token, 
                               text2$lemma)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-09-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多