【发布时间】:2013-07-20 10:42:19
【问题描述】:
我正在构建一个搜索引擎,需要对网络进行爬网、索引并能够搜索数据。
我可以单独使用 Apache Solr 还是需要先使用 Nutch 来爬网?
【问题讨论】:
我正在构建一个搜索引擎,需要对网络进行爬网、索引并能够搜索数据。
我可以单独使用 Apache Solr 还是需要先使用 Nutch 来爬网?
【问题讨论】:
您需要一个爬虫来收集内容,以便 Solr 可以对其进行索引。 Nutch 和 Crawl Anywhere 与 Solr 配合得很好。
【讨论】:
Solr 是索引器,Nutch 是 Crawler! 他们不能做彼此的工作! 如果你想要一个搜索引擎,你必须有一个爬虫和一个索引器! 您可以更改它们,甚至可以为此创建自己的应用程序!
【讨论】: