【问题标题】:Frequency of Full reindex on SolrCloudSolrCloud 上完全重新索引的频率
【发布时间】:2017-12-28 19:05:41
【问题描述】:

我需要多久在 SolrCloud 上运行一次完整的重新索引? 完整的重新索引运行需要超过 12 个小时,我们每晚都运行它,但是当 delta 运行正确时,是否真的有必要这样做。 新数据以每 30 秒每个 delta 2000 个文档的速度进入。 总索引大小:20GB 索尔:6.5.2

【问题讨论】:

    标签: solr solrcloud reindex solr6 delta-index


    【解决方案1】:

    如果 delta 运行正确,则根本不需要运行重新索引。例外情况可能是您在索引运行时没有禁用任何合并;在这种情况下,您最终可能会得到一个非常碎片化的索引文件,并且重新索引最终会构建一个完整的集合作为单个索引文件,但通常不是 Solr 的配置方式,如果是这样 - 它已经完成了原因。

    所以 - 如果您的 delta 工作正常并且您使用相当标准的设置运行 Solr,则可以安全地跳过重新索引,除非您从空索引重新开始(或架构已更改的情况)。但请确保这也包括删除 - 重新索引可能不包括已删除的元素,因此问题就变成了您的增量导入是否也处理删除。

    我们完全没有基于 Solr 的服务重新索引 - 一切都是通过实时更新和适当的合并因素完成的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-11-26
      • 2016-04-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多