【发布时间】:2016-06-07 03:37:04
【问题描述】:
我目前正在使用elasticsearch 并每 10 分钟运行一次 cron 作业,该作业将从我的数据库中查找新创建/更新的数据并将其与elasticsearch 同步。但是,我想使用 bulk 进行同步,而不是发出任意数量的请求来更新/创建索引中的文档。我使用的是 elasticsearch 创建的 elasticsearch.js 库。
我面临 2 个我不确定如何应对的挑战:
- 如何使用
bulk更新文档(如果存在),如果文档不在bulk中,则在不知道它是否存在于索引中的情况下创建一个文档。 - 如何格式化大量的
JSON以运行bulk来更新/创建文档,因为bulkapi 期望body 以某种方式格式化。
【问题讨论】:
-
这取决于您如何识别文档以进行更新/插入...此外,对于不存在的批量更新或插入,可以使用 upsert 选项:elastic.co/guide/en/elasticsearch/reference/current/…。一切都取决于您如何将数据库记录与 ES 文档相关联...
标签: elasticsearch elasticsearch-2.0