优点

1)       操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。

2)       避免了去写MapReduce,减少开发人员的学习成本。

3)       Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。

4)       Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。

5)       Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。

 

缺点

1.Hive的HQL表达能力有限

(1)迭代式算法无法表达

(2)数据挖掘方面不擅长,由于MapReduce数据处理流程的限制,效率更高的算法却无法实现。

2.Hive的效率比较低

(1)Hive自动生成的MapReduce作业,通常情况下不够智能化

(2)Hive调优比较困难,粒度较粗

相关文章:

  • 2021-11-17
  • 2021-11-17
  • 2021-11-17
  • 2021-11-30
  • 2021-11-20
  • 2021-04-21
  • 2021-09-06
  • 2021-09-19
猜你喜欢
  • 2021-04-18
  • 2022-01-22
  • 2021-10-01
  • 2022-02-05
  • 2022-12-23
  • 2022-12-23
  • 2021-12-01
相关资源
相似解决方案