【发布时间】:2015-04-29 02:40:23
【问题描述】:
我们希望根据数据可用性安排工作流程,但没有特定的数据到达频率。此外,可能会有多次数据重新运行,因此当天的数据的多个版本随时到达。
据我了解,目前在协调器中必须指定频率参数。
但是,我们希望仅根据某些事件(数据到达或分区创建)触发我们的工作流,而不依赖于频率。
似乎这符合异步数据集的条件。 Oozie 是否支持异步数据集?
【问题讨论】:
-
你解决了吗?我也有类似的要求。谢谢
-
我们知道吗,我们该怎么做? - 提到了一种方法 - 通过 shell 直接触发工作流并使用 shell 命令来感知数据。