【发布时间】:2017-01-31 16:08:50
【问题描述】:
我正在使用 Kafka 设计一个 spark 流应用程序。我有几个问题如下: 我正在将 RDBMS 表中的数据流式传输到 kafka,并使用 Spark 消费者使用 Spark - SQL 来消费消息和处理
问题: 1. 我将数据从表中流式传输到 kafka(键作为表名,值作为 JSON 记录形式的表数据)——这是正确的架构吗?
- 在 spark 消费者中,我正在尝试使用 DStream.foreachRDD(x => 转换为 x RDD) 来使用数据——我遇到了这个问题(它说转换中的转换错误不允许......我正在尝试在 foreachRDD 函数中提取键以获取表名并使用 map 函数转换 x.values 以从 JSON 转换回普通字符串,然后将每条记录保存到 Spark-sql )
这种用于数据库流式传输的架构和设计是否可行?如何解决转换问题中的转换?
问候, 皮尤什·坎萨尔
【问题讨论】:
-
在您遇到错误的地方分享您的代码将有助于更好地理解错误。如果可能,请分享代码 sn-p
标签: apache-spark apache-kafka apache-spark-sql spark-streaming