【发布时间】:2020-01-02 23:38:28
【问题描述】:
我一直在尝试使用 MoveHDFS 处理器将 parquet 文件从 hdfs 中的 /working/partition/ 目录移动到 /success/partition/ 目录。分区值是基于流程中较早的 ExecuteSparkJob 处理器设置的。在根 / 目录中找到我的 parquet 文件后,我在 Output Directory 的处理器描述中找到了以下内容:
文件将被移动到的 HDFS 目录 Supports 表达式语言:true(将使用变量注册表进行评估 仅)
原来处理器将文件发送到/ 而不是${dir}/。
由于我的属性是根据 spark 处理结果动态设置的,因此我不能简单地添加到变量注册表并为每个流文件重新启动节点(根据我的有限理解,这是使用变量注册表所需要的)。一种选择是使用带有自定义脚本的 ExecuteStreamCommand 处理器来完成此用例。这是我唯一的选择,还是有一种内置方法可以将 HDFS 文件移动到属性集目录?
【问题讨论】:
-
你使用哪个版本的 NiFi?
-
@BenYaakobi 1.8.0
标签: hdfs apache-nifi