【发布时间】:2017-02-06 21:59:21
【问题描述】:
我正在尝试集成 Spark/Kafka 以构建流式应用程序。 卡发版本:0.9 火花:1.6.2
在 RDD 批处理中处理数据后如何处理偏移量。
你能告诉我更多关于处理偏移的见解吗?
spark 是否内置了自动存储和读取偏移量的功能?还是我需要引导 spark 从 mongo 或 oracle 等商店读取偏移量?
JavaInputDStream<String> directKafkaStream = KafkaUtils.createDirectStream(jsc, String.class, String.class,
StringDecoder.class, StringDecoder.class, String.class, kafkaParams, topicMap,
(Function<MessageAndMetadata<String, String>, String>) MessageAndMetadata::message);
directKafkaStream.foreachRDD(rdd -> {
【问题讨论】:
标签: java apache-spark apache-kafka spark-streaming