【发布时间】:2016-06-09 17:45:33
【问题描述】:
我是分布式系统的新手。我知道 solrcloud 提供分布式搜索功能。据我所知,hadoop 是一个用于大数据的分布式处理框架。那我们为什么要将两个分布式框架集成在一起呢?是否用于索引和搜索 hdfs 格式的文件?将 hadoop 与 solrcloud 结合使用有哪些优势?如果有人可以详细解释或给我链接以更好地理解两者,那将非常有帮助。
【问题讨论】:
我是分布式系统的新手。我知道 solrcloud 提供分布式搜索功能。据我所知,hadoop 是一个用于大数据的分布式处理框架。那我们为什么要将两个分布式框架集成在一起呢?是否用于索引和搜索 hdfs 格式的文件?将 hadoop 与 solrcloud 结合使用有哪些优势?如果有人可以详细解释或给我链接以更好地理解两者,那将非常有帮助。
【问题讨论】:
Solr(主要)用于存储和搜索,Hadoop(主要)用于分布式处理。他们解决不同的问题。
最常见的是use Solr with HDFS to store / load its index files,用于使用 HDFS 集群中的现有功能或允许通过 Solr 搜索 processed Hadoop result。
如果您在 Google 上进行几次搜索,您会发现很多可用的用例、演示文稿和库,例如 LucidWorks' Hadoop integrations、Solr+Hadoop 或 Hortonworks' Indexing and searching data in Apache Solr。
【讨论】: