【发布时间】:2013-01-06 12:38:00
【问题描述】:
当我尝试使用 generate 命令生成 url 时出现以下错误:
GeneratorJob:java.lang.RuntimeException:作业失败:name=generate:1357474131-234134646,jobid=job_local_0001 在 org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54) 在 org.apache.nutch.crawl.GeneratorJob.run(GeneratorJob.java:191) 在 org.apache.nutch.crawl.GeneratorJob.generate(GeneratorJob.java:213) 在 org.apache.nutch.crawl.GeneratorJob.run(GeneratorJob.java:241) 在 org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65) 在 org.apache.nutch.crawl.GeneratorJob.main(GeneratorJob.java:249)
generate、fetch 和 parse 工作正常,但 updatedb 之前有时会出现此错误:
线程“主”java.lang.RuntimeException 中的异常:作业失败:name=update-table,jobid=job_local_0001 在 org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54) 在 org.apache.nutch.crawl.DbUpdaterJob.run(DbUpdaterJob.java:98) 在 org.apache.nutch.crawl.DbUpdaterJob.updateTable(DbUpdaterJob.java:105) 在 org.apache.nutch.crawl.DbUpdaterJob.run(DbUpdaterJob.java:119) 在 org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65) 在 org.apache.nutch.crawl.DbUpdaterJob.main(DbUpdaterJob.java:123)
现在,它不断给生成作业失败。可能是什么问题?会不会是mysql的问题?
【问题讨论】: