【发布时间】:2019-01-15 11:05:54
【问题描述】:
我的一个索引中有 4000 多个不同的字段。随着时间的推移,这个数字会越来越大。 由于 Elasticsearch 为每个索引提供 1000 个字段的默认限制。一定有什么原因。
现在,我认为我不应该增加 Elasticsearch 设置的限制。 所以我应该把我的单个大索引分解成多个小的索引。
在转向多个索引之前,我有几个问题如下:
小型多个索引的数量最多可以增加到 50 个。因此与单个大型索引的搜索相比,一次搜索所有 50 个索引会减慢搜索时间?
是否真的需要因为大量字段而将我的单个大索引分解为多个索引?
当我使用小的多索引时,分片的总数会急剧增加(超过 250 个分片)。每个索引将有 5 个分片(默认数字,我不想更改)。搜索这些多个索引将同时搜索这 250 个分片。这会影响我的搜索性能吗?注意:这些碎片也可能随着时间的推移而增加。 当我使用仅包含 5 个分片和大量文档的单个大索引时,这不会对这 5 个分片造成过载吗?
【问题讨论】:
-
你的字段怎么这么多?你的用例是什么?
-
我们在谈论多少数据?你有 50GB 的数据还是 5TB?另外:您是否有一个包含所有内容的索引,或者您是否每天/每周/按另一个时间表轮换索引?
-
@AtlandaGonazol 数据最大为 10gb。这不是我主要关心的问题。我也不旋转我的数据。现在,我只有一个索引,字段太多,我认为这会导致映射爆炸。
标签: elasticsearch