spark-repartition

问题描述:
streaming 消费多个topic,但是不同topic的每个分区的数据量差距很大,一个数量级以上。导致每个task消费的数据量不一样,
造成严重的数据倾斜。所以需要进行一次repartition使得处理起来比较均匀。

[ 转自 : https://www.jianshu.com/p/9690f5bcd950

   作者:pcqlegend

        链接:https://www.jianshu.com/p/9690f5bcd950

  来源:简书 ]

相关文章:

  • 2022-12-23
  • 2021-09-09
  • 2021-07-23
  • 2022-12-23
  • 2021-10-06
  • 2021-06-16
  • 2021-08-29
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-06-09
  • 2021-07-31
  • 2021-07-01
  • 2021-08-08
相关资源
相似解决方案