【发布时间】:2021-01-30 22:12:08
【问题描述】:
我正在使用 spark 结构化流从 kafka 流式传输数据,这为我提供了具有以下架构的数据帧
Column Type
key binary
value binary
topic string
partition int
offset long
timestamp long
timestampType int
Value Colum 以二进制格式出现,但它实际上是一个具有结构类型的 json 字符串,要求是读取 json 结构并屏蔽其中的几个字段并写入数据。
【问题讨论】:
标签: apache-spark apache-kafka spark-streaming spark-structured-streaming spark-streaming-kafka