【问题标题】:SolrIndexerJob: java.lang.RuntimeException: job failed:SolrIndexerJob:java.lang.RuntimeException:作业失败:
【发布时间】:2016-05-23 19:22:11
【问题描述】:

Apache nutch \"crawl" 脚本在索引到 solr 时失败。对此有什么想法吗?

IndexingJob: starting
SolrIndexerJob: java.lang.RuntimeException: job failed: name=[myId_1]Indexer, jobid=job_local483340309_0001
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:120)
        at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:154)
        at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:176)
        at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:202)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
        at org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:211)

【问题讨论】:

    标签: apache nutch


    【解决方案1】:

    此消息信息量不大,请检查/发布 Solr 日志以了解任何相关错误。造成这种情况的常见原因之一是 Nutch 和 Solr 模式之间的不匹配。

    【讨论】:

    • 10x - solr 日志声称 meta_description 应该是多值的 - 已更改 - 现在它正在工作
    【解决方案2】:

    1) 必须配置 gora.properties,

    2) 此外,Gora(Mongo、HBase、Cassandra 等)背后的任何东西都没有响应,因此 nutch 需要“waitForCompletion”,因此请确保它已启动并运行。

    确保使用 kill -9 杀死旧的已失效进程和旧的 java nutch 进程,如果找不到它们则重新启动(希望不会出现这种情况......)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-02-27
      • 2018-03-30
      • 2015-05-23
      • 1970-01-01
      相关资源
      最近更新 更多