【发布时间】:2010-08-27 09:13:05
【问题描述】:
我们有几个自定义的 nutch 字段可供爬虫抓取并编制索引。通过 solrindex(使用映射文件)将其传输到 solr 可以正常工作。日志显示一切正常,但是 solr 环境中的索引并未反映这一点。 任何帮助将不胜感激,
谢谢, 阿肖克
【问题讨论】:
我们有几个自定义的 nutch 字段可供爬虫抓取并编制索引。通过 solrindex(使用映射文件)将其传输到 solr 可以正常工作。日志显示一切正常,但是 solr 环境中的索引并未反映这一点。 任何帮助将不胜感激,
谢谢, 阿肖克
【问题讨论】:
我要做的是使用tcpmon 之类的工具来准确监控 Nutch 发送给 Solr 的内容。通过检查 xml 有效负载,您可以确定 Nutch 是否正确地将这些自定义字段发送到 Solr。如果 Nutch 正确发送它们,那么 Solr 方面就会发生一些事情。相反,重新检查您的 Nutch 代码。
【讨论】: