【问题标题】:Mapping of words to stemmed words (Stem dictionary)词到词干的映射(词干词典)
【发布时间】:2014-06-04 06:10:44
【问题描述】:

我想为我的项目生成一个 (word-stemmed word) 的映射。

我正在尝试以这种方式生成映射

1.我获取了一个文本(在文件 1 中),使用快速挖掘器来阻止所有单词并将生成的文本保存在另一个文件中,例如文件 2。

2.我编写了一个java程序,它将file1和file 2作为参数,扫描file1中的一个单词和file2中的一个单词,并将它们作为一对存储在一个Hashset中。

这种方法能完美运行吗?有没有其他更好的方法来完成这项任务。

【问题讨论】:

    标签: java nlp rapidminer stemming


    【解决方案1】:

    我再次回答我的问题..

    是的,此方法有效,但请确保删除所有标点符号、/、&、#、数字、撇号以及除字母以外的所有内容。

    只有这样映射才会完美

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-09-24
      • 2014-11-02
      • 2021-10-09
      • 2018-12-08
      相关资源
      最近更新 更多