【发布时间】:2013-05-13 08:46:26
【问题描述】:
我正在使用 apache nutch 和 solr,我的要求是解析 flv 和 epub 文件的内容,我使用下面的命令来解析文件
bin/nutch crawl urls -solr http://localhost:8983/solr/
我已将文件 urls 保存在 nutch 的 urls 文件夹中。上面的命令正在运行,但是当我尝试使用 solr 和以下命令查看解析的内容时,它只是显示文件的 url。
bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*
请给我建议....
谢谢
【问题讨论】:
标签: linux parsing solr web-crawler nutch