【问题标题】:Working with apache nutch 2.2.1使用 apache nutch 2.2.1
【发布时间】:2014-07-18 12:17:29
【问题描述】:

我正在尝试开始我的第一次抓取,我已经配置了数据库设置并执行以下命令:bin/nutch inject urls

并且错误结果如下:

InjectorJob: starting at 2014-07-18 08:13:34
InjectorJob: Injecting urlDir: urls
InjectorJob: Using class org.apache.gora.sql.store.SqlStore as the Gora storage class.
InjectorJob: java.lang.RuntimeException: job failed: name=inject urls, jobid=job_local1172062909_0001
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
        at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
        at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)

有人可以帮我吗?

【问题讨论】:

    标签: java apache nutch web-crawler gora


    【解决方案1】:

    托马斯。

    您使用的是什么版本的 Gora? SqlStore 仅在 Gora 0.1 上启用,现在是要实现的缺失功能。很抱歉这个坏消息:(我认为由于一些许可证问题,sql模块被删除了......我认为。

    抱歉这个坏消息:(总有一天这个模块肯定会回来的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多