【发布时间】:2020-01-09 03:41:39
【问题描述】:
背景
我有一个 AWS 托管的 Elascsearch v6.0 集群,它有 14 个数据实例。
它具有基于时间的索引,例如 data-2010-01、...、data-2020-01。
问题
各个实例的可用存储空间非常不平衡,我可以在 AWS 控制台中看到:
我注意到,每次 AWS 服务通过蓝绿色部署运行时,这种分布都会发生变化。 更改集群设置或 AWS 发布更新时会发生这种情况。
有时蓝绿色会导致其中一个实例完全耗尽空间。 发生这种情况时,AWS 服务会启动另一个蓝绿色,这会在不影响客户的情况下解决问题。 (不过它确实对我的心率有影响!)
分片大小
我们索引的分片大小为千兆字节,但低于 Elasticsearch recommendation 和 50GB。
不过,分片大小确实因索引而异。我们的许多旧索引只有少量文档。
问题
AWS 平衡算法平衡不好的方式,每次都会导致不同的结果,这是出乎意料的。
我的问题是算法如何选择分配给哪个实例的分片,我可以自己解决这种不平衡吗?
【问题讨论】:
标签: amazon-web-services elasticsearch sharding diskspace amazon-elasticsearch