【发布时间】:2016-01-12 12:28:46
【问题描述】:
我目前有一个依赖于数据集的 Oozie 协调器。数据集已配置为在完成时创建一个 _SUCCESS 文件以触发工作流。据我了解,工作流是根据 _SUCCESS 文件的存在触发的,但我有一个用例,在相同的 _SUCCESS 更新(即时间戳更改)的情况下,我需要重新触发工作流以运行。我想知道我将如何在 Oozie 中解决这个问题。
【问题讨论】:
我目前有一个依赖于数据集的 Oozie 协调器。数据集已配置为在完成时创建一个 _SUCCESS 文件以触发工作流。据我了解,工作流是根据 _SUCCESS 文件的存在触发的,但我有一个用例,在相同的 _SUCCESS 更新(即时间戳更改)的情况下,我需要重新触发工作流以运行。我想知道我将如何在 Oozie 中解决这个问题。
【问题讨论】:
据我了解,您更改了数据集并更新了_SUCCESS 文件。在这种情况下,我会将数据集移动到另一条路径。
例如,您的数据集位于/user/%name%/data/2015-01-12,并且协调器已完成此数据集的工作。修改后您可以将数据集移动到/user/%name%/data/2015-01-16,协调器将在下次处理新数据集。
【讨论】: