Shuffle产生Stage

Spark Shuffle相关总结

  • 这里以shuffle为界限划分两个stage
  • stage依据shuffle划分,reduce算子产生shuffle

常见shuffle算子

  • distinct
  • groupByKey
  • reduceByKey
  • aggregateByKey
  • join
  • cogroup
  • repartition

相关文章: