Hive是基于Hadoop的数据仓库,使用HQL作为查询接口、HDFS作为存储底层、mapReduce作为执行层, 基于Hadoop平台解决了企业数据仓库构建的核心技术问题,证明了Hadoop平台的强大。从而进一步降低了Hadoop使用的准入门槛。


以下为hive的架构设计与运行流程

hive架构设计与运行流程 图解

.用户接口主要有三个:CLI命令行,Client 和 Web UI

.metaStore: hive 的元数据结构描述信息库,可选用不同的关系型数据库来存储,通过配置文件修改、查看数据库配置信息

.Driver: hive核心驱动器接口类,衔接UI与内核的解析、优化、执行器的桥梁,生成的查询计划存储在HDFS中,并在随后由MapReduce调用执行

hive模块详情介绍

hive架构设计与运行流程 图解




相关文章:

  • 2021-09-05
  • 2022-01-08
  • 2021-08-28
  • 2021-05-04
  • 2022-01-09
  • 2021-12-21
  • 2021-05-03
  • 2021-12-15
猜你喜欢
  • 2022-01-08
  • 2022-01-08
  • 2022-01-26
  • 2021-08-01
  • 2022-02-04
  • 2022-12-23
相关资源
相似解决方案