【问题标题】:Documentation for bin/nutch elasticindexbin/nutch elasticindex 文档
【发布时间】:2013-07-05 14:16:03
【问题描述】:

有很多使用bin/nutch solrindex 命令的文档和示例,但是bin/nutch elasticindex 命令的覆盖范围不足。我正在努力将 Nutch 2.2.1 的实例与 Elasticsearch 0.90.2 结合起来。我尝试使用 this plugin 将 Elasticsearch 伪装成 Solr 实例,但任何 bin/crawl 作业都会因内部服务器错误而崩溃。我正在寻找的是修改为使用 Elasticsearch 的 bin/crawl 的示例或 bin/nutch elasticindex 命令的详细描述(nutch wiki 没有它的页面)。我可以简单地将每个出现的短语solrindex 替换为elasticindex 吗?

【问题讨论】:

    标签: search solr elasticsearch nutch


    【解决方案1】:

    我已修改 bin/crawl 以删除 bin/nutch solrdedup 命令,并将所有提及的 solrindex 替换为 elasticindex

    【讨论】:

      【解决方案2】:

      我认为 Nutch 2.2.x 无法与 Elasticsearch 一起使用。但与 1.8 相比,我没有看到 2.2.x 的额外好处。唯一的问题是 Nutch 2.2.x 使用 Gora 将爬取的页面保存在您选择的数据库中。由于您使用 Elasticsearch 来索引结果,我假设您不需要数据库。 我用 Elasticsearch 0.90.11 制作了 Nutch 1.8,你可以在我的 GitHub 帐户上找到这个包: https://github.com/andreivisan/NutchElasticsearch

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2011-12-18
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多