【发布时间】:2014-06-04 06:10:44
【问题描述】:
我想为我的项目生成一个 (word-stemmed word) 的映射。
我正在尝试以这种方式生成映射
1.我获取了一个文本(在文件 1 中),使用快速挖掘器来阻止所有单词并将生成的文本保存在另一个文件中,例如文件 2。
2.我编写了一个java程序,它将file1和file 2作为参数,扫描file1中的一个单词和file2中的一个单词,并将它们作为一对存储在一个Hashset中。
这种方法能完美运行吗?有没有其他更好的方法来完成这项任务。
【问题讨论】:
标签: java nlp rapidminer stemming