Spark及其生态圈概述

1.Spark的概述及特点

执行速度快、易用、通用

2.Spark的产生背景

（1）MapReduce的局限性：代码繁琐、只能支持map和reduce方法、执行效率低下、不适合迭代多次、交互式、流式的处理

（2）框架多样化：1）批处理：MapReduce、Hive、Pig；2）流式处理：Storm、Jstorm；3）交互式计算：Impala

这些需求都可以用Spark解决

3.Spark对比Hadoop

（1）Spark生态系统

Spark及其生态圈概述

（2）Hadoop生态系统对比Spark生态系统

Spark及其生态圈概述

（3）Hadoop对比Spark

Spark及其生态圈概述

（4）MapReduce对比Spark

Spark及其生态圈概述

4.Spark和Hadoop的协作性

（1）Hadoop的优势

Spark及其生态圈概述

（2）Spark的优势

Spark及其生态圈概述

（3）Hadoop+Spark

Spark及其生态圈概述

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode