【问题标题】:how can i retrieve page informations in solr?如何在 solr 中检索页面信息?
【发布时间】:2013-10-18 03:11:25
【问题描述】:

我是 nutch 和 solr 的新手。 我使用 nutch 来抓取网站,并使用 solr 来索引这些页面。 有没有一种方法可以检索 solr 数据库中的链接内容?

举例

谢谢

达尼洛

【问题讨论】:

    标签: html solr hyperlink nutch


    【解决方案1】:

    页面的文本存储在名为“内容”的字段中。请注意,这不是原始页面,而是页面的解析版本。可搜索的内容应该出现在这里,而不是元标记和 javascript 之类的内容。

    【讨论】:

    • 嗨,迈克。但是在java中我怎样才能检索这个字段内容?谢谢
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-04-08
    • 2019-07-19
    • 2015-10-27
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多