【发布时间】:2017-11-11 21:59:00
【问题描述】:
我一直在尝试从 Spark Streaming 中的 Kafka 消息中访问 NiFi Flowfile 属性。我使用 Java 作为语言。
场景是 NiFI 使用 GetSFTP 处理器从 FTP 位置读取二进制文件,并使用 publishKafka 处理器将 byte[] 消息发布到 Kafka。使用 Spark Streaming 作业将这些 byte[] 属性转换为 ASCII 数据,并将这些解码后的 ASCII 写入 Kafka 进行进一步处理,并使用 NiFi 处理器保存到 HDFS。
我的问题是我无法跟踪二进制文件名和解码的 ASCII 文件。我必须在解码的 ASCII 中添加一个标题部分(用于文件名、文件大小、记录数等),但我无法弄清楚如何从 KafkaConsumer 对象的 NiFi Flowfile 访问文件名。有没有办法可以使用标准的 NiFi 处理器来做到这一点?或者请分享任何其他建议以实现此功能。谢谢。
【问题讨论】:
标签: java apache-spark apache-kafka kafka-consumer-api apache-nifi