在 SolrCloud 中保持索引优化/合并答案

【问题标题】：Keeping index optimized / merged in SolrCloud在 SolrCloud 中保持索引优化/合并
【发布时间】：2013-07-22 17:55:16
【问题描述】：

分布式 Solr 的主从实现（在 Solr 4.x 之前）是一个直接的设计解决方案，让 master 承担索引、合并和优化索引的负载。然后索引被复制到副本，同时副本始终提供搜索服务。

有人可以解释一下 SolrCloud 现在是如何做到的吗？似乎 SolrCloud 从领导者向每个副本发送索引命令。但是如何实现搜索性能呢？在每个副本上进行索引和搜索会在每个节点服务器上产生负载（在后台索引和运行合并线程），并且由于我的索引很大，因此通常需要花费大量时间来合并段或简单地优化。我现在应该把所有这些都交付给合并策略而不用担心吗？ TieredMergePolicy 是否同时提供良好的搜索性能和低资源负载（CPU、I/O）？

【问题讨论】：

没有想法？我应该依赖 TieredMergePolicy 并且它可以完美地完成这项工作吗？

标签： solr solrcloud

【解决方案1】：

我将尝试回答您的部分问题：SolrCloud 确实在所有节点上都有索引，因此它对副本有性能影响。这是由于“热复制”模型而不是您习惯的“冷复制”模型而完成的。它用于解决数据完整性问题以及集群上的实时搜索。作为性能影响的代价，您可以获得一致的数据和更快的数据可用性。实际上，您始终可以将数据拆分为分片（以额外硬件为代价），并具有可比的性能。无论哪种情况，您都可以决定 SolrCloud 是否适合您的需求。您可以在没有云模型的情况下使用 Solr 4，并像以前一样自行管理。

【讨论】：

谢谢。这有助于并使事情变得清晰。我觉得最后我只需要尝试两种方法来检查哪种方法更适合性能要求。