Spark支持4种运行模式:
本地单机模式
本地单机模式下,所有的Spark进程均运行于同一个JVM中,并行处理则通过多线程来实现。在默认情况下,单机模式启动与本地系统的CPU核心数目相同的线程。如果要设置并行的级别,则以local[N]的格式来指定一个master变量,N表示要使用的线程数目。
集群单机模式
Spark集群由两类程序构成:一个驱动程序和多个执行程序。本地模式时所有的处理都运行在同一个JVM内,在集群模式时通常运行在多个不同的节点上。
集群单机模式通常包括:
1、一个运行Spark单机主进程和启动程序的主节点;
2、各自运行一个执行程序的进程的工作节点。
在单机集群上运行,只需要将主节点的URL(IP:PORT)设置给master变量就可以了。
基于Mesos
Mesos是一个开源集群计算框架。
基于YARN
即基于Hadoop2,与Hadoop关联形成集群计算和资源调度框架。