Apache Spark的工作原理
1 Why Apache Spark2 关于Apache Spark3 如何安装Apache Spark4 Apache Spark的工作原理5 spark弹性分布式数据集6 RDD持久性7 spark共享变量8 Spark SQL9 Spark Streaming
Spark引擎提供了一种在一组机器上分布式内存中处理数据的方法。图7显示了典型的Spark作业如何处理信息的逻辑图。
主控制如何分割数据,并利用数据位置,同时跟踪从机上的所有分布式数据计算。如果某台从机不可用,该机器上的数据将在其他可用的机器上重建。“大师”目前是一个单一的失败点,但将在即将发布的版本中修复。
公众号:it全能程序猿