【发布时间】:2011-08-26 02:34:42
【问题描述】:
有没有人有幸为 nutch 编写自定义索引器以使用 elasticsearch 索引爬网结果?或者你知道任何已经存在的吗?
【问题讨论】:
标签: lucene full-text-search web-crawler nutch elasticsearch
有没有人有幸为 nutch 编写自定义索引器以使用 elasticsearch 索引爬网结果?或者你知道任何已经存在的吗?
【问题讨论】:
标签: lucene full-text-search web-crawler nutch elasticsearch
我编写了一个模拟 Solr api 的 ElasticSearch 插件。使用这个插件和标准的 Nutch Solr 索引器,您可以轻松地将抓取的数据发送到 ElasticSearch。插件和如何与 Nutch 一起使用的示例可以在 GitHub 上找到:
【讨论】:
我知道 Nutch 将添加可插拔后端,很高兴看到它。我需要将 elasticsearch 与 Nutch 1.3 集成。代码张贴在这里。捎带 (src/java/org/apache/nutch/indexer/solr) 代码。
【讨论】:
还没有这样做,但这绝对是可行的,但需要搭载 SOLR 代码 (src/java/org/apache/nutch/indexer/solr) 并使其适应 ElasticSearch。对 Nutch BTW 会是一个不错的贡献
【讨论】:
时间过去了,现在 Nucth 已经与 ElasticSearch 很好地集成了。 Here 是一个不错的教程。
【讨论】: