【发布时间】:2009-10-16 23:20:38
【问题描述】:
如果可能的话,我正在寻找用 java 或任何其他语言编写的 Apache Lucene 网络爬虫。爬虫必须使用lucene并创建有效的lucene索引和文档文件,所以这就是nutch被淘汰的原因例如...
有人知道这样的网络爬虫存在吗?如果答案是肯定的,我可以在哪里找到它。 天呐……
【问题讨论】:
-
您的编程相关问题是什么?
-
AFAIK,lucene 没有网络爬虫,请查看java-source.net/open-source/crawlers
标签: java lucene web-crawler