【问题标题】:Keeping index optimized / merged in SolrCloud在 SolrCloud 中保持索引优化/合并
【发布时间】:2013-07-22 17:55:16
【问题描述】:

分布式 Solr 的主从实现(在 Solr 4.x 之前)是一个直接的设计解决方案,让 master 承担索引、合并和优化索引的负载。然后索引被复制到副本,同时副本始终提供搜索服务。

有人可以解释一下 SolrCloud 现在是如何做到的吗? 似乎 SolrCloud 从领导者向每个副本发送索引命令。但是如何实现搜索性能呢?在每个副本上进行索引和搜索会在每个节点服务器上产生负载(在后台索引和运行合并线程),并且由于我的索引很大,因此通常需要花费大量时间来合并段或简单地优化。 我现在应该把所有这些都交付给合并策略而不用担心吗? TieredMergePolicy 是否同时提供良好的搜索性能和低资源负载(CPU、I/O)?

【问题讨论】:

  • 没有想法?我应该依赖 TieredMergePolicy 并且它可以完美地完成这项工作吗?

标签: solr solrcloud


【解决方案1】:

我将尝试回答您的部分问题:SolrCloud 确实在所有节点上都有索引,因此它对副本有性能影响。这是由于“热复制”模型而不是您习惯的“冷复制”模型而完成的。它用于解决数据完整性问题以及集群上的实时搜索。作为性能影响的代价,您可以获得一致的数据和更快的数据可用性。实际上,您始终可以将数据拆分为分片(以额外硬件为代价),并具有可比的性能。 无论哪种情况,您都可以决定 SolrCloud 是否适合您的需求。您可以在没有云模型的情况下使用 Solr 4,并像以前一样自行管理。

【讨论】:

  • 谢谢。这有助于并使事情变得清晰。我觉得最后我只需要尝试两种方法来检查哪种方法更适合性能要求。
猜你喜欢
  • 1970-01-01
  • 2016-07-14
  • 1970-01-01
  • 2016-04-01
  • 2018-12-11
  • 1970-01-01
  • 2012-11-14
  • 2015-06-03
  • 1970-01-01
相关资源
最近更新 更多