【发布时间】:2017-04-17 11:12:48
【问题描述】:
根据NiFi's homepage,它“支持数据路由、转换和系统中介逻辑的强大且可扩展的有向图”。
过去几个月我一直在使用 NiFi,不禁想知道为什么不将它也用于调度批处理。
假设我有一个用例,其中数据流入 Hadoop,由一系列 Hive\MapReduce 作业处理,然后导出到某个外部 NoSql 数据库以供某个系统使用。 p>
使用 NiFi 将数据摄取并流入 Hadoop 是 NiFi 的一个用例。
但是,使用 Nifi 来安排 Hadoop 上的作业(“Oozie-like”)是我没有遇到其他实现的用例,并且由于它似乎完全可以实现,我试图了解是否有原因不要这样做。
在 NiFi 上完成这一切的好处是,人们将在一个地方获得从源到目的地的整个数据过程的可视化表示。在复杂流程的情况下,维护非常重要。
换句话说 - 我的问题是:是否有理由不使用 NiFi 作为批处理的调度程序\协调器?如果是这样 - 在这样的用例中可能会出现什么问题?
PS - 我读过这个:“Is Nifi having batch processing?” - 但我的问题是针对“NiFi 中的批处理”的不同意义,而不是附加问题中提出的问题
【问题讨论】:
标签: hadoop batch-processing oozie apache-nifi