【发布时间】:2010-10-06 08:03:01
【问题描述】:
如何设置每个主机索引的最大页数? 我不想索引网站的所有百万页面,我只想索引前 100000 个找到的页面。
【问题讨论】:
-
我使用 solr 作为前端,nutch 作为爬虫,我以这种方式运行爬虫: bin/nutch crawl urls/all -dir crawl -threads 25 -depth 10 -topN 1000 -索尔localhost:9001/solr
标签: full-text-search solr search-engine nutch