【发布时间】:2014-08-03 01:38:52
【问题描述】:
我能够验证新闻组数据是否存在输入目录(在 /tmp 下)。不知道为什么我得到一个文件未找到异常。
$ sh 分类-20newsgroups.sh 请选择一个数字选择对应的任务运行 1. 朴素贝叶斯 2.sgd 3. clean -- 清理 /tmp/mahout-work-rsrinivasan 中的工作区 输入您的选择:1 好的。您选择了 1,我们将使用 naivebayes 在 /tmp/mahout-work-rsrinivasan 创建工作目录 准备训练数据 MAHOUT_LOCAL 未设置;将 HADOOP_CONF_DIR 添加到类路径。 没有设置 HADOOP_HOME,在本地运行 SLF4J:类路径包含多个 SLF4J 绑定。 SLF4J:在 [jar:file:/C:/cygwin/usr/local/mahout/examples/target/mahout-examples-0.6-job.jar!/org/slf4j/impl/StaticLoggerBinder.class] 中找到绑定 SLF4J:在 [jar:file:/C:/cygwin/usr/local/mahout/examples/target/dependency/slf4j-jcl-1.6.1.jar!/org/slf4j/impl/StaticLoggerBinder.class] 中找到绑定 SLF4J:在 [jar:file:/C:/cygwin/usr/local/mahout/examples/target/dependency/slf4j-log4j12-1.6.1.jar!/org/slf4j/impl/StaticLoggerBinder.class] 中找到绑定 SLF4J:请参阅http://www.slf4j.org/codes.html#multiple_bindings 了解说明。 12/05/14 09:13:44 WARN driver.MahoutDriver:在类路径中找不到 org.apache.mahout.classifier.bayes.PrepareTwentyNewsgroups.props,将仅使用命令行参数 线程“主”java.io.FileNotFoundException 中的异常:找不到输入目录 \tmp\mahout-work-rsrinivasan\20news-bydate\20news-bydate-train 在 org.apache.mahout.classifier.bayes.PrepareTwentyNewsgroups.main(PrepareTwentyNewsgroups.java:92) 在 sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 在 sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) 在 sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25) 在 java.lang.reflect.Method.invoke(Method.java:597) 在 org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:68) 在 org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:139) 在 org.apache.mahout.driver.MahoutDriver.main(MahoutDriver.java:188)
【问题讨论】: