【问题标题】:Elasticsearch Best Shard CountElasticsearch 最佳分片计数
【发布时间】:2020-10-15 07:59:24
【问题描述】:

我有一个包含 2.3TB 数据的集群。不断访问/删除/添加数据。

目前基础设施很紧张,所以我正在研究优化。 100 个碎片太多了。

我看到每个分片 30GB 应该是最大的答案,然后我听说“每个节点应该只有 3 个分片”。我目前在 4 个节点上。这可以提高。

那么我应该继续使用 100 个分片(这使得每个分片 20-25GB)还是应该将索引缩小到 12 个分片(3 个分片 x 4 个节点)?

在这种情况下,最佳做法是什么?保持速度。

【问题讨论】:

    标签: elasticsearch sharding


    【解决方案1】:

    您说得对,分片和副本在搜索和索引以及 Elasticsearch 的整体性能中起着非常重要的作用,但是您缺少一些重要的概念,这些概念在 opster's shard and replica guide 中有详细介绍。

    这应该有助于确定根本原因,并让您深入了解如何提高 Elasticsearch 集群的性能。

    另外,您的陈述 每个节点应该只有 3 个分片是不正确的,两种最佳做法都是有一个分片大小 b/w 30-50 GB 和一个节点中的分片数取决于 Elasticsearch 进程的 JVM 及其大小和您的用例。

    【讨论】:

    • 谢谢!这正是我一直在寻找的:) 欣赏它!抱歉迟到了答案。
    • @ilovejq 没问题,很高兴它对你有用:)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-08-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多