Hive的架构原理以及运行原理

Hive的架构原理

Hive的架构原理以及运行原理

一、客户端：Hive是Mapreduce的客户端，Hive的客户端有两种方式：

CLI：命令行的方式
JDBC:这种我们也可以通过java代码来实现，不过一般不这样做。

二、四个器

解析器：将SQL字符串转换成抽象语法树AST，这一步一般都用第三方工具库完成，解析器是对sql的语法，表是否存在，以及字段是否存在做检查，hql通过了解析器就说明语法上没有问题
编译器:根据AST生成执行计划
优化器：对逻辑执行计划进行优化
执行器：将逻辑执行计划转换为可以运行的物理计划，对于hive来说就是hadoop或者spark

三、Hive的类似于关系型数据库

hive有自己的执行引擎，就是Mapreduce。
hive存储数据使用的是hdfs
hive的元数据存储的位置是关系型数据库

四、Hive的运行机制

Hive的架构原理以及运行原理

hive将结构化的数据存储在hdfs中
hive通过sql语句创建出与hdfs中的元数据所对应的表信息，这些信息就是元数据metastore，是存储在关系型数据库当中的。然后通过映射关系关联元数据和结构化的数据
同时meta store中还记录着表对应文件的path，然后会生成hive中的metastore
文件的path，然后会生成hive中的metastore
解析器去根据路径查询hdfs中的数据，解析器还会将sql语言解析成对应的mapreduce程序，并且生成对应的jar包

相关文章：

2022-12-23
2021-08-06
2022-01-23
2022-12-23
2021-08-25
2021-06-30
2021-09-03
2021-11-14

猜你喜欢

2021-04-20
2021-10-10
2021-08-01
2021-10-14
2021-11-09
2021-07-29

相关资源

下载 2023-01-01
下载 2021-06-05
下载 2023-01-07

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode