【发布时间】:2017-07-05 20:08:30
【问题描述】:
在以前的版本中,有一个名为spark.shuffle.manage的配置,用于确定Spark中shuffle算法的类型。从 Spark 2.0 开始,这个配置被删除了。默认的随机播放算法是基于排序的。据我了解,只有满足所有要求,才会启用 Tungsten shuffle。我如何知道当前作业是使用原始的基于排序的 shuffle 还是 Tungsten 排序?
非常感谢。
【问题讨论】:
标签: apache-spark shuffle