【发布时间】:2018-10-01 16:09:10
【问题描述】:
我从 FTP 接收 tar 文件并在解压后将其保存到 HDFS。所以我目前的管道看起来像这样。
ListFTP -> FetchFTP -> UnpackContent -> PutHDFS
此 tar 包含 10 个文件,因此对于单个 tar 文件,会生成 10 个流文件。我的要求是在 HDFS 中存储 3 个特定文件后触发另一个作业。我应该使用哪个处理器,或者是否有其他方法可以使用 Nifi 解决这个问题?
【问题讨论】:
-
你有什么问题?您是想将文件合并为每批 3 个文件,还是可以将文件写入 10 个不同的文件,并且只想在将 3 个特定文件写入 HDFS 后触发作业?
-
我只想在 3 个特定文件写入 HDFS 后触发作业。
标签: apache-nifi