大数据数据仓库Hive概述

1.Hive产生背景

（1）MapReduce的不便性

（2）HDFS上的文件缺少Schema

2.Hive是什么？

（1）由Facebook开源的，最初用于解决海量结构化的日志数据统计问题

（2）构建在hadoop之上的数据仓库

（3）Hive定义了一种类SQL查询语言：HQL

（4）通常用于进行离线数据处理（采用MapReduce）

（5）底层支持多种不同的执行引擎（MapReduce、Tez、Spark）

（6）支持多种不同的压缩格式、存储格式以及自定义函数

3.为什么使用Hive？

（1）简单、容易上手（提供了类似SQL查询语言HQL）

（2）为超大数据集设计的计算/存储扩展能力（MR计算、HDFS存储）

（3）统一的元数据管理（可与Presto/Impala/Spark SQL等共享数据）

4.Hive的体系结构

大数据数据仓库Hive概述

相关文章：

2021-11-17
2021-09-17
2021-05-12
2021-07-10
2021-09-30
2021-09-16
2021-07-03

猜你喜欢

2022-01-04
2021-05-20
2021-06-14
2021-04-10
2021-12-03

相关资源

下载 2023-02-01
下载 2021-06-06
下载 2023-03-29

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode