【发布时间】:2021-03-16 15:34:35
【问题描述】:
我在带有 Java openjdk 版本“1.8.0_275”的 Red Hat Enterprise Linux 版本 8.3 (Ootpa) 上运行 Nutch 1.18
我正在遵循这些指示:https://cwiki.apache.org/confluence/display/NUTCH/NutchTutorial#NutchTutorial-Step-by-Step:Concepts
当我到达bin/nutch fetch $s1 的步骤时,每次获取都失败了。请参阅下面的 hadoop 日志中的示例错误。它们都因 java.lang.NumberFormatException 而失败。我可以使用 curl 来检查 url 是否可以访问。
任何建议将不胜感激。
at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65)
at java.lang.Integer.parseInt(Integer.java:583)
at java.lang.Integer.parseInt(Integer.java:615)
at org.apache.hadoop.conf.Configuration.getInt(Configuration.java:1486)
at org.apache.nutch.protocol.http.api.HttpBase.setConf(HttpBase.java:212)
at org.apache.nutch.protocol.http.Http.setConf(Http.java:52)
at org.apache.nutch.plugin.Extension.getExtensionInstance(Extension.java:169)
at org.apache.nutch.protocol.ProtocolFactory.getProtocolInstanceByExtension(ProtocolFactory.java:177)
at org.apache.nutch.protocol.ProtocolFactory.getProtocol(ProtocolFactory.java:155)
at org.apache.nutch.fetcher.FetcherThread.run(FetcherThread.java:308)```
【问题讨论】:
标签: nutch