【发布时间】:2017-07-02 00:16:29
【问题描述】:
我正在使用 scala 并使用以下 Spark Streaming 方法使用来自 Kafka 的数据:
val lines = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams, topics).map(_._2)
Above 变量返回 InputDStream,通过它我可以使用以下代码查看原始/二进制格式的数据: println(行)
但我需要在原始/二进制格式上应用 avro 格式(可用模式),以便以预期的 json 格式查看数据。为了应用avro格式,我需要将上面的InputDStream转换为avro使用的Array[Bytes]。
有人可以告诉我将 InputDStream 转换为 Array[Bytes] 吗?
或者
如果您知道在 InputDStream(of spark Streaming) 上应用 avro 模式的更好方法,请分享。
【问题讨论】:
标签: scala apache-spark apache-kafka spark-streaming avro