【问题标题】:NLP: lemmatization with lemmaGen c++NLP:使用 lemmaGen c++ 进行词形还原
【发布时间】:2013-01-28 19:20:05
【问题描述】:

我正在增强一个聊天机器人,我希望从输入句子中找到单词的引理。聊天机器人是用 c++ 编写的,我发现了一个免费的开源词形还原工具,称为 LemmaGen。我已经下载了 c++ 2.2 版,但它没有关于如何引用甚至使用它的文档。

过去有没有人使用 LemmaGen for c++ 的经验?任何信息都会有所帮助。 非常感谢

【问题讨论】:

  • 词形还原是一项具有挑战性的任务。
  • 您是否成功地使用了 lemmaGen 进行 C++?我目前面临同样的问题。我可以请你回答吗? stackoverflow.com/questions/37151476/… 在这里?

标签: c++ nlp lemmatization


【解决方案1】:

我没有使用 c++ 版本,但我确实使用了 C# 版本。在 C# 中使用 LemmaGen 很简单,也很直接。首先你用模型文件的参数初始化 Lemmatizer 类型的对象,然后你可以调用它的公共方法来 Lemmatize 表示为字符串的单词。因此,您所要做的就是对文本进行标记,然后对每个标记逐个进行词形还原。方法返回表示输入词引理的字符串。

我猜C++版本的使用是类似的。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-06-09
    • 2020-10-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-01-05
    • 2014-05-24
    相关资源
    最近更新 更多