【发布时间】:2017-02-21 11:50:51
【问题描述】:
我正在使用 spark 1.6 并遇到了这个函数 reduceByKeyAndWindow,我用它来对通过 kafka 主题传输的数据执行字数统计。
以下是 reduceByKeyAndWindow 提供的替代方案列表。正如我们所见,所有备选方案都具有相似的签名,但带有额外的参数。
但是,当我仅将 reduceByKeyAndWindow 与 reduce 函数或 reduce 函数和持续时间一起使用时,它可以工作并且不会给我任何错误,如下所示。
但是当我使用具有减少功能、持续时间和滑动窗口时间的替代方案时,它开始给我以下错误,其他替代方案也会发生同样的情况,如下所示。
我不确定这里发生了什么以及如何解决问题。
感谢任何帮助
【问题讨论】:
-
reduceByKeyAndWindow(_ + _, _ - _, Minutes(10), Seconds(2), 2)这个对我有用.. -
回答了您的问题...
标签: scala apache-spark mapreduce spark-streaming word-count