【问题标题】:search engine to search documents from a local database搜索引擎从本地数据库中搜索文档
【发布时间】:2012-01-31 14:35:00
【问题描述】:

我正在寻找一个搜索引擎,它可以根据搜索查询从我的本地数据库中查找文档。该过程不涉及任何网页。它们仅包括一组文本文档(pdf 和 doc 文件)。 请为此过程推荐一些高效的搜索引擎。

【问题讨论】:

    标签: search-engine text-mining


    【解决方案1】:

    我会先尝试Solr(它建立在 Lucene 之上)。还带有一个不错的基于 Web 的管理工具。

    【讨论】:

    • 太棒了。我的要求只是输入一个查询并从本地数据库中准确获取最佳文档集。
    • 试试 Ambar ambar.rdseventeen.com,它非常好用并且有简单的 REST API
    【解决方案2】:

    工具

    1. Solr:强大的文本搜索和动态聚类。尝试其中的示例文档。

    2. Mahout : 流行的聚类算法已经存在

    3. Lucene:全功能文本搜索引擎库

    在我看来,Solr 将是搜索目的的最佳选择。

    【讨论】:

      【解决方案3】:

      我建议使用 Lucene /Lucene.Net,但可以在 herehere 找到替代方案。

      【讨论】:

      • 谢谢。但我想知道其中哪一个是最有效的?你能帮我解决这个问题吗?
      • 在不了解您的要求的情况下,将无法回答哪个是最有效/最好的,因为每种解决方案都有其特定的优缺点。
      • 我的数据库将包含大约 200 个文本文档(主要是 pdf)。我的任务涉及使用参考文档生成许多查询,然后使用这些查询来搜索与参考文档最匹配的文档。所以我会有很多查询,我希望至少有一个平均准确度。
      猜你喜欢
      • 2011-06-06
      • 2017-07-23
      • 2010-09-22
      • 1970-01-01
      • 2017-11-25
      • 2014-04-14
      • 2013-07-20
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多