【发布时间】:2018-01-20 03:52:47
【问题描述】:
我在具有 java 1.8 的 Windows 10 上使用 Apache Nutch 1.14。我已按照https://wiki.apache.org/nutch/NutchTutorial 中提到的相同步骤进行操作。
当我尝试使用 cygwin 上的命令在 crawldb 中注入 URL 时:bin/nutch injection crawl/crawldb urls
我收到以下错误: 注入器:java.io.IOException:命令字符串中的(null)条目:null chmod 0644 E:\apache-nutch-1.4\runtime\local\crawl\crawldb.locked 在 org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:773)
我检查了日志,发现:
2018-01-18 10:55:26,785 错误 util.Shell - 无法在 hadoop 二进制路径中找到 winutils 二进制文件 java.io.IOException: 无法在 Hadoop 二进制文件中找到可执行的 null\bin\winutils.exe。
我在几页上搜索过这个错误,但没有任何帮助。
【问题讨论】:
标签: apache hadoop cygwin nutch