chengjianxiaoxue

 

 

 

1 组件:

spark core:  离线计算

spark sql : 交互式查询

spark streaming : 实时流计算

spark mllib : 机器学习

spark graphx :  图计算

 

图:

 

 

 

spark主要做大数据计算

hadoop 大数据的存储

spark+hadoop是一个完美组合 

 

 

 

 

spark和mapreduce 计算框架的对比:

spark streaming和storm的对比

 

 

spark sql和hive的对比:

 

 

分类:

技术点:

相关文章: