在MapReduce中shuffle和Spark的shuffle的过程有一些区别。这里做一下具体的介绍。

Mapreduce的shuffle过程图解

Spark Shuffle过程详细分析

Spark shuffle过程图解

注意:spark shuffle过程中没有分区和排序的过程,而且存储结果存储在内存中,所以速度要比mapreduce要快很多。

Spark Shuffle过程详细分析

先就到这里吧,图解的说明应该比较清晰了。有问题欢迎留言


本文转自  ChinaUnicom110  51CTO博客,原文链接:http://blog.51cto.com/xingyue2011/1951179

相关文章: