【发布时间】:2014-03-02 23:18:55
【问题描述】:
我已经使用 solr 来索引和搜索 pdf 文件。它工作正常。现在据说我在我的项目中使用 Mahout,并被告知将其与 solr 集成。我是这项技术的新手,所以请从头开始帮助我。以一种基本的方式...... 我是否需要先下载并安装 mahout,或者模式和 solrconfig 中的修改会成功吗?为了集成 tika 功能,它只是在配置文件中进行了修改。
【问题讨论】:
我已经使用 solr 来索引和搜索 pdf 文件。它工作正常。现在据说我在我的项目中使用 Mahout,并被告知将其与 solr 集成。我是这项技术的新手,所以请从头开始帮助我。以一种基本的方式...... 我是否需要先下载并安装 mahout,或者模式和 solrconfig 中的修改会成功吗?为了集成 tika 功能,它只是在配置文件中进行了修改。
【问题讨论】:
Mahout 是一个单独的项目,因此您必须下载、安装并学习如何使用它……这不是一个下午的事情。
但是,您应该知道this Lucene clasiffication module(Solr 构建在 Lucene 之上)。它不像 Mahout 那样完整,但对于不是大型项目,它可以很好地工作。优点是它与 Lucene/Solr 集成,因此您要做的工作要少得多。我已经成功使用了 Sorl4.6
【讨论】: