【发布时间】:2023-01-06 22:13:14
【问题描述】:
全新安装 nutch 1.19 和 solr 8.11.2 后出现问题。运行爬网过程后,爬网结束并出现 NullPointerException 和以下错误消息:
运行错误: /opt/solr/apache-nutch-1.19/bin/nutch fetch -Dsolr.server.url=http//localhost:8983/solr/nutch -Dmapreduce.job.reduces=2 -Dmapreduce.reduce.speculative=false -Dmapreduce .map.speculative=false -Dmapreduce.map.output.compress=true -D fetcher.timelimit.mins=180 crawl/segments/20230106121647 -threads 50 失败,退出值 255。
有谁知道是什么导致了这个错误?
【问题讨论】:
-
如果没有 NullPointerException 的堆栈跟踪或爬虫日志(stdout 或 hadoop.log)中的某些上下文,很难说出导致错误的原因。
-
以下是 hadoop.log 中的最新日志条目:
-
java.lang.Exception:java.lang.OutOfMemoryError:无法创建本机线程:可能在 org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:492) 处达到内存不足或进程/资源限制 ~ [hadoop-mapreduce-client-common-3.3.4.jar:?] 在 org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:552) ~[hadoop-mapreduce-client-common-3.3。 4.jar:?] Caused by: java.lang.OutOfMemoryError: unable to create native thread: possibly out of memory or process/resource limits reached ...