使用 River for Oracle 的弹性搜索中的累积数据索引

【问题标题】：Cumulative data indexing in elastic search using river for Oracle使用 River for Oracle 的弹性搜索中的累积数据索引
【发布时间】：2015-02-22 22:06:53
【问题描述】：

我正在使用 Oracle 数据库，并且正在使用弹性搜索实现搜索。我们使用 River 并每 5 分钟执行一次以提取最新执行后更新的数据。

如果河流总是正常工作，那么就没有问题。在某些情况下，Oracle 必须运行专门的服务，然后拉取在 5 分钟之间更新的数据并不能正常工作。

所以我认为我们必须从上次执行时间中提取数据，我该怎么做？是否可以在 DB 或 Elastic Search 中保留最后一次成功执行时间？

【问题讨论】：

标签： oracle elasticsearch

【解决方案1】：

想到了两种方法。一种是在数据表中添加一列，以指示数据是否已提取。这需要您在提取每一行时对其进行更新，这可能看起来很繁重，但它可以让您非常清楚地了解已提取的内容，并且无需进行日期/时间比较，我发现这可能相对耗时。我更喜欢这个解决方案，因为过去我发现它非常简单。

第二种方法是有一个“设置”表，并在设置表中记录上次成功提取的时间。在我看来，这是替代方案中不太理想的方法，因为它没有明确指出已提取哪些行。

YMMV.

分享和享受。

【讨论】：