【发布时间】:2014-04-14 00:07:00
【问题描述】:
我正在尝试按照tutorial 在 Ubuntu 12.04 上部署 nutch 2.1。一切顺利 直到我尝试将 url 注入数据库。当我输入 ($bin/nutch injection urls) 并按下 输入我得到
InjectorJob: starting
InjectorJob: urlDir: urls
并一直呆在那里(几个小时),直到我决定取消执行。 urls 是一个目录 包含带有 url 的文件。我按照here 的建议在 nutch-site.xml 中添加了代理和端口详细信息,但它没有解决。我尝试了 apache nutch 2.2.1,但问题仍然存在。
如果你知道如何解决这个问题,请帮助我!
提前致谢。
【问题讨论】: