【问题标题】:How to use Kafka consumer in spark如何在 Spark 中使用 Kafka 消费者
【发布时间】:2018-09-11 15:34:44
【问题描述】:

我正在使用 spark 2.1 和 Kafka 0.10.1。

我想通过每天读取Kafka中特定主题的全部数据来处理数据。

对于火花流,我知道createDirectStream 只需要包含主题列表和一些配置信息作为参数。

但是,我意识到createRDD 必须包含所有主题、分区和偏移信息。

我想让批处理像 Spark 中的流式处理一样方便。

有可能吗?

【问题讨论】:

  • 你有没有碰巧得到你的问题的答案?

标签: scala apache-spark apache-kafka kafka-consumer-api


【解决方案1】:

我建议你从Cloudera阅读这篇文章。

此示例向您展示如何从 Kafka 一次性获取数据。由于 ACID 架构,您将在 postgres 中保留偏移量。

所以我希望这能解决你的问题。

【讨论】:

    猜你喜欢
    • 2017-02-23
    • 2014-12-30
    • 2018-12-18
    • 1970-01-01
    • 1970-01-01
    • 2020-05-23
    • 2016-07-30
    • 2015-09-03
    • 1970-01-01
    相关资源
    最近更新 更多