【问题标题】:Cumulative data indexing in elastic search using river for Oracle使用 River for Oracle 的弹性搜索中的累积数据索引
【发布时间】:2015-02-22 22:06:53
【问题描述】:

我正在使用 Oracle 数据库,并且正在使用弹性搜索实现搜索。 我们使用 River 并每 5 分钟执行一次以提取最新执行后更新的数据。

如果河流总是正常工作,那么就没有问题。 在某些情况下,Oracle 必须运行专门的服务,然后拉取在 5 分钟之间更新的数据并不能正常工作。

所以我认为我们必须从上次执行时间中提取数据,我该怎么做? 是否可以在 DB 或 Elastic Search 中保留最后一次成功执行时间?

【问题讨论】:

    标签: oracle elasticsearch


    【解决方案1】:

    想到了两种方法。一种是在数据表中添加一列,以指示数据是否已提取。这需要您在提取每一行时对其进行更新,这可能看起来很繁重,但它可以让您非常清楚地了解已提取的内容,并且无需进行日期/时间比较,我发现这可能相对耗时。我更喜欢这个解决方案,因为过去我发现它非常简单。

    第二种方法是有一个“设置”表,并在设置表中记录上次成功提取的时间。在我看来,这是替代方案中不太理想的方法,因为它没有明确指出已提取哪些行。

    YMMV.

    分享和享受。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2013-06-03
      • 1970-01-01
      • 2019-12-03
      • 1970-01-01
      • 1970-01-01
      • 2012-05-07
      • 1970-01-01
      相关资源
      最近更新 更多