【发布时间】:2018-07-28 02:18:48
【问题描述】:
我有一个包含多个重复条目的索引。它们具有不同的 id,但其他字段具有相同的内容。
例如:
{id: 1, content: 'content1'}
{id: 2, content: 'content1'}
{id: 3, content: 'content2'}
{id: 4, content: 'content2'}
删除重复项后:
{id: 1, content: 'content1'}
{id: 3, content: 'content2'}
有没有办法删除所有重复项并只保留一个不同的条目而不手动比较所有条目?
【问题讨论】:
-
使用您自己的 id 来确保幂等性。这意味着对于内容:“content1”,您应该始终拥有相同的 id
-
但对我来说不是这样。我正在使用给定的索引。在这个索引中有多个单独的条目,它们包含相同的内容。因此,我想删除这些重复项。
-
您的
content字段是如何映射的?那是string、analyzed或not_analyzed吗? -
您可以创建另一个以内容为 id 的索引。然后通过快照/恢复或扫描和滚动将现有索引迁移到新索引
-
首先是什么导致重复条目?
标签: elasticsearch