【发布时间】:2018-09-11 15:34:44
【问题描述】:
我正在使用 spark 2.1 和 Kafka 0.10.1。
我想通过每天读取Kafka中特定主题的全部数据来处理数据。
对于火花流,我知道createDirectStream 只需要包含主题列表和一些配置信息作为参数。
但是,我意识到createRDD 必须包含所有主题、分区和偏移信息。
我想让批处理像 Spark 中的流式处理一样方便。
有可能吗?
【问题讨论】:
-
你有没有碰巧得到你的问题的答案?
标签: scala apache-spark apache-kafka kafka-consumer-api