【问题标题】:solrindex way of mapping nutch schema to solr将 nutch 模式映射到 solr 的 solrindex 方式
【发布时间】:2010-08-27 09:13:05
【问题描述】:

我们有几个自定义的 nutch 字段可供爬虫抓取并编制索引。通过 solrindex(使用映射文件)将其传输到 solr 可以正常工作。日志显示一切正常,但是 solr 环境中的索引并未反映这一点。 任何帮助将不胜感激,

谢谢, 阿肖克

【问题讨论】:

    标签: solr nutch


    【解决方案1】:

    我要做的是使用tcpmon 之类的工具来准确监控 Nutch 发送给 Solr 的内容。通过检查 xml 有效负载,您可以确定 Nutch 是否正确地将这些自定义字段发送到 Solr。如果 Nutch 正确发送它们,那么 Solr 方面就会发生一些事情。相反,重新检查您的 Nutch 代码。

    【讨论】:

    • 感谢您的快速回复,帕斯卡。我按照您的建议做了,并意识到只有核心和插件字段是正在映射的传入 NutchDocument 的一部分。我意识到我的问题是我正在使用另一个安装的 nutch,它没有将自定义字段添加到 nutch 索引的插件。所以我确信在最初的“爬网”安装中,solr 索引也会有额外的自定义字段。希望这可以帮助某人。再次感谢您。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-12-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-11-19
    • 1970-01-01
    相关资源
    最近更新 更多