【发布时间】:2014-03-25 14:23:05
【问题描述】:
我一直在研究诸如 porter 算法之类的词干算法,但到目前为止我发现的所有内容都将文件作为输入处理。
是否有任何现有的算法可以让我简单地向词干分析器传递一个字符串,并让它返回词干提取的字符串?
类似:
String toBeStemmed = "The man worked tirelessly";
Stemmer s = new Stemmer();
String stemmed = s.stem(toBeStemmed);
【问题讨论】:
-
一个关于搬运工的好网站是tartarus.org/martin/PorterStemmer
标签: java algorithm stemming porter-stemmer