【发布时间】:2014-05-12 23:59:38
【问题描述】:
我正在尝试使用此问题中的代码 - Stop words and stemmer in java
我的 Lucene 项目是 maven 项目 (https://github.com/tdunning/MiA) 的一部分。
当我尝试将上面链接中给出的代码包含在 src/ 文件夹内的文件夹中时,构建过程失败。 maven 编译器说 org.apache.lucene.analysis.core 不存在(这是 StopFilter 的依赖项)。同样,无法解决 PorterStemmer 的依赖关系。我试图在 maven 项目中环顾四周,但无法弄清楚他们使用的 lucene 版本。能够通过 Lucene 使用此代码提取词干的最佳方法是什么?
P.S:我是各种 java 构建工具的新手,如果这个问题听起来很愚蠢,很抱歉。
编辑:我设法解决了 PorterStemmer 并决定在没有 lucene 的情况下过滤停用词,因此该项目有效,但如果有人可以帮助我解决 StopWordFilter 依赖项,我将不胜感激。
【问题讨论】: