【发布时间】:2015-04-26 01:53:42
【问题描述】:
在我对 ElasticSearch 索引过程的理解中,我遇到了一个问题。我已经读过this article,它说,倒排索引存储所有文档的所有标记并且它是不可变的。因此,要更新它,我们必须删除它并重新索引所有数据以使所有文档都可搜索。
但我已经阅读了有关部分更新文档的信息(自动将它们标记为“已删除”并插入+索引新文档)。但是在那些没有提到重新索引所有以前的数据的文章中。
所以,接下来我不能正确理解:当我更新文档(包含 100 000 个单词的文本文档)并且已经存储了一些其他索引文档时 - 是否真的会在每个 UPDATE 或 INSERT 操作重新索引过程中进行我所有的文件?
基本上我依赖默认的 ElasticSearch 设置(5 个主分片,每个分片一个副本,集群中有 2 个节点)
【问题讨论】:
-
我也建议不要在帖子中问一个以上的问题
-
谢谢,我已经更新了我的问题
标签: java elasticsearch lucene