【问题标题】:Basic doubts about Nutch关于 Nutch 的基本疑问
【发布时间】:2013-08-08 00:39:48
【问题描述】:

现在我有一个项目,我需要在其中构建一个搜索引擎,但我不能使用 Solr,只能使用 nutch 和 lucece,虽然我在论坛中搜索,所以我发现很多人说 nutch 做索引,我安装了 nutch (1.4) 并爬取了数据,但意识到我没有索引文件夹或类似的东西,只有爬取的数据。所以,问题是,nutch 是否真的索引它爬取的内容,或者它需要 Lucene 进行索引和搜索?

PS。对于这个项目,我不能使用 Solr,只能使用纯 nutch 和 lucene,我需要使用 Java 构建所有东西,所以当人们说 nutch 实际上索引时,我真的很困惑......对不起我的英语不好,它不是我的母语...

【问题讨论】:

    标签: lucene indexing nutch


    【解决方案1】:

    Nutch 不会索引您的数据,它不使用 Lucene,因此它无法创建自己的索引。 Nutch 必须将文档传递给 Solr 才能对其进行索引。

    查看:nutch vs solr indexing

    【讨论】:

      【解决方案2】:

      Lucene 用于 Nutch 的索引和搜索。据我了解 Nutch,它将找到的页面传递给 Lucene 进行索引。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2021-01-03
        • 1970-01-01
        • 1970-01-01
        • 2015-09-16
        • 2012-04-02
        • 2018-06-02
        • 1970-01-01
        相关资源
        最近更新 更多